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“The long-awaited second edition of Wesley Chun? s Core Python 
Programming proves to be well worth the wait—its deep and broad coverage 
and useful exercises will help readers learn and practice good Python. " 

—Alex Martelli, author of Python in a Nutshell and editor of Python 
Cookbook 

“对 陈 仲 才 «Python Fate) BMWA E AERE REB GRY 
它 的 全 面 以 及 书 中 实用 的 练习 将 会 帮助 读者 学 会 并 掌握 杰出 的 Python 技能 ” 

一 一 亚 历 克 斯 。 马 特 利 CAlex Martelli) 《Python in a Nutshel1》 一 书 作 
者 ， 以 及 《Python Cookbook》 的 编辑 


“There has been lot of good buzz around Wesley Chun” s Core Python 
Programming. It turns out that all the buzz is well earned. I think this 
is the best book currently available for learning Python. I would recommend 
Chun’ s book over Learning Python (0' Reilly), Programming Python 

(0? Reilly), or The Quick Python Book (Manning). ” 

—David Mertz, Ph.D., IBM DeveloperWorks? 

“之 前 就 听 到 许多 对 陈 仲 才 《Python 核 心 编程 》 的 溢 美 之 词 ， 最 终 这 些 褒奖 
被 证 明 都 没有 言 过 其 实 。 我 想 这 是 现今 学 习 Python 最 出 色 的 书籍 了。 我 认为 仲 才 
的 书 超越 《Learning Python) (0”Reilly 出 版 社 ) , «Programming Python) 
(0”Reilly 社 ) ， 以 及 《Quick Python Book) (Manning 出 版 社 ) ” 

一 一 大 卫 。 梅 尔 北 (David Mertz) ， 哲 学 博士 ，IBM DeveloperWorks 


“T have been doing a lot of research [on] Python for the past year 
and have seen a number of positive reviews of your book. The sentiment 
expressed confirms the opinion that Core Python Programming is now 
considered the standard introductory text. " 

—Richard Ozaki, Lockheed Martin 

“我 在 过 去 的 一 年 里 对 Python 进行 了 许多 研究 ， 并 且 读 到 了 许多 对 你 作品 的 
肯定 评价 。 这 些 评述 准确 的 表达 了 一 个 观点 ， 这 就 是 《Python 核心 编程 》 现 在 被 
看 作 是 一 本 权威 的 Python 读本 。” 

一 一 理 查 德 。 尾 崎 (Richard Ozaki) ， 洛 克 西 德 。 马 丁 (Lockheed Martin) 
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*Finally, a book good enough to be both a textbook and a reference 





on the 
Python language now exists. " 
—Michael Baxter, Linux Journal 


“最 终 ， 一 本 杰出 的 融 教材 和 参考 书目 于 一 身 的 Python 书籍 诞生 了 。。?” 
一 一 迈克 尔 。 巴 克 斯 特 (Michael Baxter) , «Linux Journal) 


“Very well written. It is the clearest, friendliest book I have come 
across yet for explaining Python, and putting it in a wider context. It 
does not presume a large amount of other experience. It does go into some 
important Python topics carefully and in depth. Unlike too many beginner 
books, it never condescends or tortures the reader with childish 
hide-and-seek prose games. [It] sticks to gaining a solid grasp of Python 

syntax and structure. " 

—http://python. org bookstore Web site 

“非常 不 错 的 作品 。 这 是 我 迄今 遇 到 的 最 清楚 最 友好 的 前 释 Python 的 书籍 了 ， 
并 且 它 还 将 Python 引入 了 更 广阔 的 领域 。 它 没有 冒昧 的 大 量 引用 其 他 经 验 ， 而 是 
谨慎 、 深 入 的 探索 了 Python 的 一 些 重要 主题 。 与 许多 入 门 读 物 不 同 ， 本 书 不 会 用 
小 孩子 捉迷藏 般 的 文字 游戏 折磨 或 施 惠 于 读者 。 它 紧 紧 扣 住 了 Python 语法 和 结构 
这 两 个 主题 。” 
一 一 http://python. org 网 上 书店 


“[If ] I could only own one Python book, it would be Core Python 
Programming by Wesley Chun. This book manages to cover more topics in more 
depth than Learning Python but includes it all in one book that also more 
than adequately covers the core language. [If] you are in the market for 
just one book about Python, I recommend this book. You will enjoy reading 
it, including its wry programmer! s wit. More importantly, you will learn 
Python. Even more importantly, you will find it invaluable in helping you 
in your day-to-day Python programming life. Well done, Mr. Chun!" 


E 


—Ron Stephens, Python Learning Foundation 
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“假如 〉 我 只 能 拥有 一 本 Python 书 籍 ， 那 肯定 就 是 陈 仲 才 的 《Python 核 心 
编程 》。 它 涵盖 了 《Learning Python》 的 全 部 主题 ， 但 是 却 更 加 深入 宽泛 ， 所 以 
这 绝 不 单单 是 一 本 充分 包含 了 核心 语言 的 书籍 。 如 果 你 只 想 在 市 面 上 购买 一 本 
Python 书籍 的 话 ， 我 向 你 推荐 本 书 。 你 会 享受 阅读 的 ， 包 括 它 里 面 会 经 常 幽 程序 
员 的 一 默 。 更 重要 的 是 ， 你 将 学 会 Python。 更 更 重要 的 是 ， 你 会 在 日 复 一 日 的 编 
程 生 活 中 受益 不 尽 。 好 样 的 ， 仲 才 兄 ! ” 

一 一 罗 罗 。 斯 蒂 芬 (Ron Stephens) ，Python 学 习 基 金 


*l think the best language for beginners is Python, without a doubt. 
My favorite book is Core Python Programming. " 
—s003apr, MP3Car. com Forums 
^ z& JG SERI. MOS eRe HUS RB PRUATJNUEPython. mg XPythonfZ4» 
编程 》 则 是 我 的 最 爱 。” 
一 一 s003apr，MP3Car. com 论 坛 


“Personally, I really like Python. It' s simple to learn, completely 
intuitive, amazingly flexible, and pretty darned fast. Python has only 
just started to claim mindshare in the Windows world, but look for it to 

start gaining lots of support as people discover it. To learn Python, I' d 
start with Core PythonProgramming by Wesley Chun. " 

— Bill Boswell, MCSE, Microsoft Certified Professional Magazine 
Online 

“就 我 个 人 而 言 ， 我 喜欢 Python。 它 简单 易学 、 二 分 直观 、 具 有 惊人 的 灵活 
性 、 而 且 快 到 岂 有 此 理 !Python 刚 刚才 开始 引 来 了 Windows 世 界 应 有 的 关注 。 但 是 ， 
如 同人 们 发 现 它 的 过 程 一 般 ， 让 这 种 关注 的 深入 需要 足够 的 支撑 。 学 习 Python， 
我 选择 从 陈 仲 才 的 《Python 核心 编程 》 开 始 。?” 

一 一 比尔 。 博 斯 韦 尔 (Bill Boswell) ， 微 软 认 证 系统 工程 师 ，《 微 软 认证 
专家 在 线 杂 志 》 


“If you learn well from books, I suggest Core Python Programming. It 
is by far the best I' ve found. I' m a Python newbie as well and in three 
months time I' ve been able to implement Python in projects at work 
(automating MSOffice, SQL DB stuff, etc.)." 
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“如 果 你 能 通过 书籍 高 效 学 习 ， 我 推荐 《Python 核心 编程 》。 它 是 我 迄今 为 
正 发 现 的 最 好 的 书 了 。 三 个 月 前 我 还 是 一 只 Python 菜鸟 ， 如 今 我 却 已 经 可 以 在 工 
作 的 项 目 〈 微 软 0ffice 自 动 化 ，SQL DB 填充 等 等 ) 中 应 用 Python 了 。?” 


——ptonman, Dev Shed 论 坛 





“Python is simply a beautiful language. It’ s easy to learn, it’ s 
cross-platform, and it works. It has achieved many of the technical goals 
that Java strives for. A one-sentence description of Python would be: ‘All 
other languages appear to have evolved over time— but Python was designed. ' 
And it was designed well. Unfortunately, there aren' t a large number of 
books for Python. The best one I' ve run across so far is Core Python 
Programming. " 

—Chris Timmons, C. R. Timmons Consulting 


“Python 是 一 门 美丽 的 语言 。 它 简单 易学 ， 跨 平台 ， 而 且 运 转 良 好 。 达 成 了 
许多 Java 一 直 求 索 的 技术 目标 。 一 言 以 英之 就 是 : ”其 他 的 语言 是 与 时 代 同 步 ， 
To Python FR a’ 而且 计划 得 颇 为 出 色 .。 遗憾 的 是 , 并 没有 足够 多 的 Python 

书籍 。 至 今 最 禁 得 起 考验 的 就 当 属 《Python 核心 编程 》 了 。” 
一 一 克 里 斯 。 提 曼 斯 (Chris Timmons) , C. R. Timmons% %4 7] 


“If you like the Prentice Hall Core series, another good full-blown 
treatment to consider would be Core Python Programming. It addresses in 
elaborate concrete detail many practical topics that get little, if any, 
coverage in other books. " 

—Mitchell L Model, MLM Consulting 

“如 果 你 喜欢 Prentice Hall Core 系 列 ， 那 么 《Python 核心 编程 》 就 称 得 上 
是 另 一 席 盛 宣 。 它 通过 对 技术 细节 的 精心 曾 述 令 许 多 实用 的 主题 变 得 易于 消化 ， 
同类 书籍 中 ， 无 出 其 右 ” 

一 一 米 切 尔 。L。 莫 多 (Mitchell L Model) ，MLM 咨 询 公 司 
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欢迎 来 到 Python 世界 ! 
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Chapter 


开篇 将 介绍 一 些 Python 的 背景 知识 ,包括 什么 是 Python, Python 的 起 源 和 它 的 一 些 关 健 
特性 。 一 旦 你 来 了 兴致 ， 我 们 就 会 向 你 介绍 怎样 获得 Python 以 及 如 何在 你 的 系统 上 安装 并 运 
行 它 。 本 章 最 后 的 练习 将 会 帮助 你 非常 自如 地 使 用 Python， 包 括 使 用 交互 式 解释 器 以 及 创建 
并 运行 脚本 程序 。 





1. 1 什么 是 Python 





Python 是 一 门 优雅 而 健壮 的 编程 语言 ， 它 继承 了 传统 编译 语言 的 强大 性 和 通用 性 ， 同 时 也 
昔 鉴 了 简单 脚本 和 解释 语言 的 易 用 性 。 它 可 以 帮 你 完成 工作 ， 而 且 一 段 时 间 以 后 ， 你 还 能 看 明 
白 自 己 写 的 这 段 代 码 。 你 会 对 自己 如 此 快 地 学 会 它 和 它 强 大 的 功能 感到 十 分 的 恢 讶 ， 更 不 用 提 
你 已 经 完成 的 工作 了 ! 只 有 你 想不到 ， 没 有 Python 做 不 到 


1. 2 起 源 
DUEE* YU * BRE (Guido van Rossum) 于 1989 年 底 始 创 了 Python, FSI, thi Ze tap = 

的 CWI (Centrum voor Wiskunde en Informatica， 国 家 数学 和 计算 机 科学 研究 院 ) 。1991 年 
4], Python 发 布 了 第 一 个 公开 发 行 版 。 这 一 切 究竟 是 如 何 开 始 的 呢 ? RC. C++. Lisp, Java 
和 Perl 一 样 ，Python 来 自 于 某 个 研究 项 目 ， 项 目 中 的 那些 程序 员 利 用 手边 现 有 的 工具 辛苦 的 
工作 着 ， 他 们 设想 并 开发 出 了 更 好 的 解决 办 法 。 
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那 时 范 。 罗 萨 姆 是 一 位 研究 人 员 ， 对 解释 型 语言 ABC 有 着 丰富 的 设计 经 验 ， 这 个 语言 同样 
也 是 在 CWI 开发 的 。 但 是 他 不 满足 其 有 限 的 开发 能 力 。 已 经 使 用 并 参与 开发 了 像 ABC 这 样 的 高 
级 语言 后 ， 再 退回 到 C 语言 显然 是 不 可 能 的 。 他 所 期 望 的 工具 有 一 些 是 用 于 完成 日 常 系统 管理 
任务 的 , 而 且 它 还 希望 能 够 访问 Amoeba 分 布 式 操作 系统 的 系统 调用 。 尽 管 范 。 罗 萨 姆 也 曾 想 过 
为 Amoeba 开发 专用 语言 , 但 是 创造 一 种 通用 的 程序 设计 语言 显然 更 加 明智 ,于 是 在 1989 ER, 
Python 的 种 子 被 播 下 了 。 


1. 3 特点 


尽管 Python 已 经 流行 了 超过 15 年 ,但 是 一 些 人 仍旧 认为 相对 于 通用 软件 开发 产业 而 言 ， 
它 还 是 个 新 丁 。 我 们 应 当 谨 慎 地 使 用 “相对 ”这 个 词 ， 因 为 “网 络 时 代 ” 的 程序 开发 ， 几 年 看 
上 去 就 像 几 十 年 。 
当 人 们 询问 : “什么 是 Python? ”的 时 候 ， 很 难 用 任何 一 个 有 具象 来 描述 它 。 人 们 更 倾 癌 于 
一 口气 不 加 思索 地 说 出 他 们 对 Python 的 所 有 感觉 ，Python 是 〈 请 填写 ) ”， 这 些 特点 究竟 
| + 















































1.3.1 高 级 
伴随 着 每 一 代 编程 语言 的 产生 ， 我 们 会 达到 一 个 新 的 高 度 。 汇 编 语 言 是 上 帝 献 给 那些 挣扎 
在 机 器 代码 中 的 人 的 礼物 ， 后 来 有 了 FORTRAN, C 和 Pascal 语言 ， 它 们 将 计算 提升 到 了 轩 新 
的 高 度 ， 并 且 开 创 了 软件 开发 行业 。 伴 随 着 C 语言 诞生 了 更 多 的 像 C, Java 这 样 的 现代 编译 
语言 。 我 们 没有 止步 于 此 ， 于 是 有 了 强大 的 、 可 以 进行 系统 调用 的 解释 型 脚本 语言 ， 例 如 Tcl. 
Perl 和 Python。 



































这 些 语言 都 有 高 级 的 数据 结构 ， 这 样 就 减少 了 以 前 “框架 ”开发 需要 的 时 间 。 像 Python 中 
的 列表 (大 小 可 变 的 数组 ) 和 字典 ( 哈 希 表 ) 就 是 内 建 于 语言 本 身 的 。 在 核心 语言 中 提供 这 些 
重要 的 构建 单元 , 可 以 鼓励 人 们 使 用 它们 , 缩短 开发 时 间 与 代码 量 , 产生 出 可 读 性 更 好 的 代码 。 

E C 语言 中 ， 对 于 混杂 数组 (Python 中 的 列表 ) 和 哈 希 表 (Python 中 的 字典 ) 还 没有 相 
应 的 标准 库 ， 所 以 它们 经 常 被 重复 实现 ， 并 被 复制 到 每 个 新 项 目 中 去 。 这 个 过 程 混 乱 而 且 容 易 
产生 错误 。C++ 使 用 标准 模版 库 改 进 了 这 种 情况 ， 但 是 标准 模版 库 是 很 难 与 Python 内 建 的 列表 
和 字典 的 简洁 和 易 读 相提并论 的 。 
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1.3.2 面向 对 象 


建议 : 面向 对 象 编程 为 数据 和 逻辑 相 分 离 的 结构 化 和 过 程 化 编程 添加 了 新 的 活力 。 面 向 对 
象 编程 文 持 将 特定 的 行为 、 特 性 以 及 和 /或 功能 与 它们 要 处 理 或 所 代表 的 数据 结合 在 一 起 。 
Python 的 面向 对 象 的 特性 是 与 生 俱 来 的 。 然 而 ，Python 绝 不 想 Java 或 Ruby 仅仅 是 一 门面 向 对 
象 语 言 ， 事 实 上 它 融 汇 了 多 种 编程 风格 。 例 如 ， 它 甚至 借鉴 了 一 些 像 Lisp 和 Haskell 这 样 的 函 
数 语言 的 特性 。 






































1.3.3 可 升级 


大 家 常常 将 Python 与 批 处 理 或 Unix 系统 下 的 shell 相提并论 。 简 单 的 shell 脚本 可 以 用 

来 处 理 简单 的 任务 ， 就 算 它们 可 以 在 长 度 上 无 限度 的 ) 增长 ， 但 是 功能 总 会 有 所 穷尽 。Shel1l 

脚本 的 代码 重用 度 很 低 ， 因 此 ， 你 只 能 止步 于 小 项 目 。 实 际 上 ， 即 使 一 些小 项 目 也 可 能 导致 脚 

本 又 自 又 长 。Python 却 不 是 这 样 ， 你 可 以 不 断 地 在 各 个 项 目 中 完善 你 的 代码 ， 添 加 额外 的 新 的 

或 者 现存 的 Python 元 素 ， 也 可 以 重用 您 脑海 中 的 代码 。Python 提倡 简洁 的 代码 设计 、 高 级 的 
apo ME: 
























































一 致 性 并 缩短 必要 的 调试 时 间 。 

“可 升级 ”这 个 术语 最 经 常用 于 衡量 硬件 的 负载 ， 通 第 指 为 系统 添加 了 新 的 硬件 后 带 来 
的 性 能 提升 。 我 们 乐于 在 这 里 对 这 个 引述 概念 加 以 区 分 ， 我 们 试图 用 “可 升级 ”来 传达 一 种 观 
念 ， 这 就 是 : Python 提供 了 基本 的 开发 模块 ， 你 可 以 在 它 上 面 开发 你 的 软件 ， 而 且 当 这 些 需 要 
扩展 和 增长 时 ，Python 的 可 插入 性 和 模块 化 架构 则 能 使 你 的 项 目 生机 号 然 和 易于 管理 。 


1.3.4 可 扩展 

就 算 你 的 项 目 中 有 大 量 的 Python 代码 , 你 也 依旧 可 以 有 条 不 率 地 通过 将 其 分 离 为 多 个 文件 
或 模块 加 以 组 织 管理 。 而 且 你 可 以 从 一 个 模块 中 选取 代码 ， 而 从 男 一 个 模块 中 读 取 属 性 。 更 棱 
的 是 ， 对 于 所 有 模块 ，Python 的 访问 语法 都 是 相同 的 。 不 管 这 个 模块 是 Python 标准 库 中 的 还 
是 你 一 分 钟 之 前 创造 的 ， 哪 怕 是 你 用 其 他 语言 写 的 扩展 都 没 问 题 ! 借助 这 些 特 点 ， 你 会 感觉 自 
己 根据 需要 “扩展 ”了 这 门 语言 ， 而 且 你 已 经 这 么 做 了 。 

代码 中 的 瓶颈 , 可 能 是 在 性 能 分 析 中 总 排 在 前 面 的 那些 热门 或 者 一 些 特别 强调 性 能 的 地 方 ， 
可 以 作为 Python 扩展 用 C 重 写 。 。 需 要 重申 的 是 ， 这 些 接口 和 纯 Python 模块 的 接口 是 一 模 
一 样 的 ， 乃 至 代码 和 对 象 的 访问 方法 也 是 如 出 一 辐 的 。 唯 一 不 同 的 是 ， 这 些 代码 为 性 能 和 带 来 了 
显著 的 提升 。 自 然 ， 这 全 部 取决 你 的 应 用 程序 以 及 它 对 资源 的 需求 情况 。 很 多 时 候 ， 使 用 编译 
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型 代码 重 写 程序 的 瓶颈 部 分 绝对 是 益处 多 多 的 ， 因 为 它 能 明显 提升 整体 性 能 。 

程序 设计 语言 中 的 这 种 可 扩展 性 使 得 工程 师 能 够 灵活 附加 或 定制 工具 ， 缩 短 开 发 周期 。 虽 
然 像 C. CHISR Java 等 主流 第 三 代 语 言 GL) 都 拥有 该 特性 ， 但 是 这 么 容易 地 使 用 C 编写 
扩展 确实 是 Python 的 优势 。 此外, WAH PyRex 这 样 的 工具 , 允许 C 和 Python 混合 编程 ， 
使 编写 扩展 更 加 轻而易举 ， 因 为 它 会 把 所 有 的 代码 都 转换 成 C 语言 代码 。 

因为 Python 的 标准 实现 是 使 用 C 语言 完成 的 (也 就 是 CPython) , 所 以 要 使 用 C 和 C++ 
编写 Python 扩展 。Python 的 Java 实现 被 称 作 Jython， 要 使 用 Java 编写 其 扩展 。 最 后 ， 
还 有 IronPython， 这 是 针对 .NET 或 Mono 平台 的 CH 实现 。 你 可 以 使 用 CH 或 者 VB. Net 扩 
展 IronPython。 
























































1.3.5 可 移植 性 
在 各 种 不 同 的 系统 上 可 以 看 到 Python 的 身影 ， 这 是 由 于 在 今天 的 计算 机 领域 ，Python 取 
得 了 持续 快速 的 成 长 。 因 为 Python 是 用 C 写 的 ， 又 由 于 C 的 可 移植 性 ， 使 得 Python 可 以 运行 
在 任何 带 有 ANSI C 编译 器 的 平台 上 。 尽 管 有 一 些 针对 不 同 平台 开发 的 特有 模块 ， 但 是 在 任何 一 
个 平台 上 用 Python 开发 的 通用 软件 都 可 以 稍 事 修改 或 者 原封 不 动 的 在 其 他 平台 上 运行 。 这 种 
人 BETTER k 




















1.3.6 易学 
Python 关键 字 少 、 结 构 简单 、 语 法 清晰 。 这 样 就 使 得 学 习 者 可 以 在 相对 更 短 的 时 间 内 轻松 
上 手 。 对 初学 者 而 言 ， 可 能 感觉 比较 新 鲜 的 东西 可 能 就 是 Python 的 面向 对 象 特 点 了 。 那 些 还 未 
能 全 部 精通 OOP (Object Oriented Programming， 面 向 对 象 的 程序 设计 ) 的 人 对 径直 使 用 Python 
还 是 有 所 顾忌 的 ， 但 是 OOP 并 非 必须 或 者 强制 的 。 入 门 也 是 很 简单 的 ， 你 可 以 先 稍 加 涉猎 ， 等 
到 有 所 准备 之 后 才 开始 使 用 。 




















1.3.7 Aw 

Python 与 其 他 语言 显著 的 差异 是 ， 它 没有 其 他 语言 通常 用 来 访问 变量 、 定 义 代码 块 和 进行 
模式 匹配 的 命令 式 符号 。 通 常 这 些 符号 包括 : 美元 符号 ($) 、 分 号 (;) 、 波 浪 号 (~) 等 等 。 
没有 这 些 分 神 的 家 伙 ，Python RAGA Ie SUM A FE. URS REE IE CBR 
ED 的 是 ， 不 像 其 他 语言 ，Python SUGAR PLA i BE E HERO NE HART, Tiii 
他 人 很 快 就 能 理解 你 写 的 代码 ， 反 之 亦 然 。 如 前 所 述 ， 一 门 语言 的 可 读 性 让 它 更 易于 学 习 。 我 
们 甚至 敢 冒 昧 的 声称 ， 即 使 对 那些 之 前 连 一行 Python 代码 都 没 看 过 的 人 来 说 ， 那 些 代码 也 是 
相当 容易 理解 的 。 看 看 下 一 章节 一 一 “起 步 ” 中 的 例子 ， 然 后 告诉 我 们 你 的 进展 是 多 么 神速 。 
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1.3.8 易 维 护 
源 代 码 维护 是 软件 开发 生命 周期 的 组 成 部 分 。 只 要 不 被 其 他 软件 取代 或 者 被 放弃 使 用 ， 你 
的 软件 通常 会 保持 继续 的 再 开发 。 这 通常 可 比 一 个 程序 员 在 一 家 公司 的 在 职 时 间 要 长 得 多 了 。 
Python 项 目的 成 功 很 大 程度 上 要 归功 于 其 源 代 码 的 易于 维护 ， 当 然 这 也 要 视 代 码 长 度 和 复杂 度 
而 定 。 然 而 ， 得 出 这 个 结论 并 不 难 ， 因 为 Python 本 身 就 是 易于 学 习 和 阅读 的 。Python 另外 一 
个 激动 人 心 的 优势 就 是 ， 当 你 在 阅读 自己 六 个 月 之 前 写 的 脚本 程序 的 时 候 ， 不 会 把 自己 搞 得 
头 雾 水 ， 也 不 需要 借助 参考 手册 才能 读 懂 自己 的 软件 。 


1.3.9 健壮 性 

没有 什么 能 够 比 允 许 程 序 员 在 错误 发 生 的 时 候 根据 出 错 条 件 提供 处 理 机 制 更 有 效 的 了 。 针 
对 错误 ，Python 提供 了 “安全 合理 ”的 退出 机 制 ， 让 程序 员 能 掌控 局 面 。 一 旦 你 的 Python 由 
于 错误 崩溃 ， 解 释 程序 就 会 转 出 一 个 “堆栈 跟踪 ”， 那 里 面 有 可 用 到 的 全 部 信息 ， 包 括 你 程序 
崩溃 的 原因 以 及 是 那 段 代码 〈 文 件 名 、 行 数 、 行 数 调用 等 等 ) 出 错 了 。 这 些 错误 被 称 为 异常 。 
如 果 在 运行 时 发 生 这 样 的 错误 ，Python 使 你 能 够 监控 这 些 错误 并 进行 处 理 。 

这 些 异常 处 理 可 以 采取 相应 的 措施 , 例如 解决 问题 、 重 定向 程序 流 、 执 行 清除 或 维护 步 又 、 
正常 关闭 应 用 程序 、 亦 或 干脆 忽略 掉 。 无 论 如 何 , 这 都 可 以 有 效 的 缩减 开发 周期 中 的 调试 环节 。 
Python 的 健壮 性 对 软件 设计 师 和 用 户 而 言 都 是 大 有 助 益 的 。 一 旦 某 些 错误 处 理 不 当 , Python 也 
还 能 提供 一 些 信息 ， 作 为 某 个 错误 结果 而 产生 的 堆栈 追踪 不 仅 可 以 描述 错误 的 类 型 和 位 置 ， 还 
能 指出 代码 所 在 模块 。 


1. 3. 10 高 效 的 快速 原型 开发 工具 

我 们 之 前 已 经 提 到 了 Python 是 多 么 的 易学 易 读 。 但 是 , 你 或 许 要 问 了 , BASIC 也 是 如 此 啊 ， 
Python FAHA HARE? 与 那些 封闭 僵化 的 语言 不 同 , Python 有 许多 面向 其 他 系统 的 接口 ， 
它 的 功能 足够 强大 , 本 身 也 足够 强壮 , 所 以 完全 可 以 使 用 Python 开发 整个 系统 的 原型 。 显 然 ， 
传统 的 编译 型 语言 也 能 实现 同样 的 系统 建 模 , 但 是 Python 工程 方面 的 简洁 性 让 我 们 可 以 在 同样 
的 时 间 内 游 丸 有 余 的 完成 相同 的 工作 。 此 外 ， 大 家 已 经 为 Python 开发 了 为 数 众多 的 扩展 库 ， 所 
以 无 论 你 打算 开发 什么 样 的 应 用 程序 ， 都 可 能 找到 先行 的 前 辈 。 你 所 要 做 的 全 部 事情 ， 就 是 来 
个 “ 即 插 即 用 ”当然 ， 也 要 自行 配置 一 番 ) ! 只 要 你 能 想 得 出 来 ，Python 模块 和 包 就 能 帮 你 
实现 。Python 标准 库 是 很 完备 的 ， 如 果 你 在 其 中 找 不 到 所 需 ， 那 么 第 三 方 模块 或 包 就 会 为 你 完 
成 工作 提供 可 能 。 
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1.3.11 内 存 管理 器 
C 或 者 C++ 最 大 的 弊病 在 于 内 存 管理 是 由 开发 者 负责 的 。 所 以 哪怕 是 对 于 一 个 很 少 访问 、 修 
改 和 管理 内 存 的 应 用 程序 ， 程 序 员 也 必须 在 执行 了 基本 任务 之 外 履行 这 些 职责 。 这 些 加 诸 在 开 
发 者 身上 的 没有 必要 的 负担 和 责任 常常 会 分 散 精 力 。 
在 Python 中 ， 由 于 内 存 管理 是 由 Python 解释 器 负责 的 ， 所 以 开发 人 员 就 可 以 从 内 存 事务 
中 解放 出 来 ， 全 神 贯 注 于 最 直接 的 目标 ， 仅 仅 致力 于 开发 计划 中 首要 的 应 用 程序 。 这 会 使 错误 
更 少 、 程 序 更 健壮 、 开 发 周期 更 短 。 


1.3.12 解释 性 和 CZT) 编译 性 
Python 是 一 种 解释 型 语言 ， 这 意味 着 开发 过 程 中 没有 了 编译 这 个 环节 。 一 般 来 说 ， 由 于 不 
是 以 本 地 机 器 码 运 行 ,纯粹 的 解释 型 语言 通常 比 编译 型 语言 运行 的 慢 。 然 而 ,类 似 于 Java, Python 
实际 上 是 字 节 编译 的 ,其 结果 就 是 可 以 生成 一 种 近似 机 器 语言 的 中 间 形 式 。 这 不 仅 改善 了 Python 
的 性 能 ， 还 同时 使 它 保持 了 解释 型 语言 的 优点 。 




















































































































核心 笔记 : 文件 扩展 名 
Python 源 文件 通常 用 . py 扩展 名 。 当 源 文 件 被 解释 器 加 载 或 者 显 式 地 进行 字 节 码 编译 的 时 
候 会 被 编译 成 字 节 码 。 由 于 调用 解释 器 的 方式 不 同 ， 源 文件 会 被 编译 成 带 有 . pyc BK. pyo 扩展 
名 的 文件 ， 你 可 以 在 第 12 章 “ 模 块 ” 学 到 更 多 的 关于 扩展 名 的 知识 。 


1.4 下载 和 安装 Python 








得 到 所 有 Python 相关 软件 最 直接 的 方法 就 是 去 访问 它 的 网 站 (http://python. org) . X 
了 方便 读者 ， 你 也 可 以 访问 本 书 的 网 站 (http://corepython. com) 并 点 击 左 侧 的 “Download 
Python” 链 接 一 一 我 们 在 表格 中 罗列 了 当前 针对 大 多 数 平台 的 Python 版本， 当然， 这 还 是 主要 
集中 在 “三 巨头 ”身上 : Unix, Win32 和 MacOS X. 

正如 我 们 在 前 面 1. 3.5 小 节 中 提 到 的 ，Python 的 可 应 用 平台 非常 广泛 。 我 们 可 以 将 其 划分 
成 如 下 的 几 大 类 和 可 用 平台 : 














所 有 Unix 衍生 系统 (Linux，Mac0S X, Solaris, FreeBSD 等 等 ) 

Win32 家 族 (Windows NT，2000，XP 等 等 ) 

早期 平台 : MacOS 8/9, Windows 3.x, DOS, 0S/2, AIX 

掌上 平台 (掌上 电脑 /移动 电话 ) : Nokia Series 60/SymbianOS, Windows CE/Pocket 
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PC, Sharp Zaurus/arm-linux, PalmOS 

游戏 控制 台 : Sony PS2, PSP, Nintendo GameCube 
实时 平台 : VxWorks, QNX 

其 他 实现 版 本 : Jython, IronPython, stackless 
其 他 





Python 大 部 分 的 最 近 版 本 都 只 是 针对 “三 巨头 ”的 。 实 际 上 ， 最 新 的 Linux 和 MacOS X 版 
本 都 已 经 安装 好 了 Python 一 一 你 只 需 查 看 一 下 是 哪个 版 本 。 尽 管 其 他 平台 只 能 找到 相对 较 早 的 
2. x 对 应 版 本 , 但 是 就 1.5 版 而 言 这 些 版 本 也 有 了 显著 的 改进 。 一 些 平 台 有 其 对 应 二 进 制版 本 ， 
可 以 直接 安装 ， 另 外 一 些 则 需要 在 安装 前 手工 编译 。 














Unix 衍生 系统 (Linux, MacOS X, Solaris, FreeBSD 等 等 ) 
正如 前 文 所 述 , 基于 Unix 的 系统 可 能 已 经 安装 了 Python。 最 好 的 检查 方法 就 是 通过 命令 
行 运 行 Python， 查 看 它 是 否 在 搜索 路 径 中 而 且 运 行 正 常 。 只 需 输入 : 








myMac:~ wesley$ python 
Python 2.4 (#4, Mar 19 2005, 03:25:10) 
[GCC 8.8 20030304 (Apple Computer, Inc. build 1671)] on darwin 
Type "help", "copyright", "credits" or "license" for more information. 
o d 
If starting Python fails, it doesn' t mean it' s not installed, just that it' s 
not in your path. Hunt around for it, and if you’ re unsuccessful, try building it manu- 
ally, which isn’ t very difficult (see “Build It Yourself” on the 
next page). If you’ re using certain versions of Linux, you can get the binary or 
source RPMs. 


Windows/DOS 系统 
首先 从 前 文 提 到 的 «python. org 或 是 corepython. com 网 站 下 载 msi 文件 〈 例 如 ， 
python-2.5.msi) ， 之 后 执行 该 文件 安装 Python。 如 果 你 打算 开发 Win32 程序 , 例如 使 用 COM 
或 MFC， 或 者 需要 Win32 库 ， 强 烈 建议 下 载 并 安装 Python 的 Windows 扩展 。 之 后 你 就 可 以 
通过 DOS 命令 行 窗口 或 者 IDLE 和 Pythonwin 中 的 一 个 来 运行 Python Y, IDLE 是 Python Wk 
省 的 IDE (Integrated Development Environment， 焦 成 开发 环境 ) ， 而 Pythonwin 则 来 自 
Windows 扩展 模块 。 
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自己 动手 编译 Python 
对 绝 大 多 数 其 它 平台 ， FR . tgz 文件 ， 解压 缩 这 些 文件 ， 然后 执行 以 下 操作 以 编译 
Python : 
L ./configure 
2 make 
pt make install 








Python 通常 被 安装 在 固定 的 位 置 ， 所 以 你 很 容易 就 能 找到 。 如 今 ， 在 系统 上 安装 多 种 版 本 
的 Python 已 经 是 司空 见 惯 的 事情 了 。 虽然 容易 找到 二 进 制 执行 文件 ， 你 还 是 要 设置 好 库 文件 的 
安装 位 置 。 

fr Unix 中 ， 可 执行 文件 通常 会 将 Python 安装 到 /usr/local/bin 子 目 录 下 ， 而 库 文件 则 通 
常安 装 在 /usr/local/Lib/python2.x 子 目录 下 ， 其 中 的 2.x 是 你 正在 使 用 的 版 本 号 。Mac0S X 
系统 中 ，Python 则 安装 在 /sw/bin 以 及 /或 者 /usr/local/bin 子 目录 下 。 而 库 文件 则 在 
/sw/ lib, /usr/local/1ib， 以 及 /或 者 /Library/Frameworks/Python. framework/Versions 子 . 























目录 下 。 

在 Windows 中 ， 默 认 的 安装 地 址 是 C:\Python2x。 请 避免 将 其 安装 在 C:\Program Files 
目录 下 。 是 的 ， 我 们 知道 这 是 通常 安装 程序 的 文件 夹 。 但 是 DOS 是 不 支持 “Program Files” 
这 样 的 长 文件 名 的 ， 它 通常 会 被 用 “Prograv1” 这 个 别名 代替 。 这 有 可 能 给 程序 运行 带 来 一 些 
厅 烦 ， 所 以 最 好 尽量 避免 。 所 以 ， 听 我 的 ， 将 Python 安装 在 C:\Python 目录 下 ， 这 样 标准 库 文 
件 就 会 被 安装 在 C:\Python\Lib 目录 下 。 























1.5 运行 Python 
有 三 种 不 同 的 办 法 来 启动 Python。 最 简单 的 方式 就 是 交互 式 的 启动 解释 器 ， 每 次 输入 一 行 
Python 代码 来 执行 。 另 外 一 种 启动 Python 的 方法 是 运行 Python 脚本 。 这 样 会 调用 相关 的 脚本 
解释 器 。 最 后 一 种 办 法 就 是 用 集成 开发 环境 中 的 图 形 用 户 界面 运行 Python。 集 成 开发 环境 通常 
整合 了 其 他 的 工具 ， 例 如 集成 的 调试 器 、 文 本 编辑 器 ， 而 且 文 持 各 种 像 CVS 这 样 的 源 代 码 版 本 
空 制 工具 。 























1.5.1 命令 行 上 的 交互 式 解 释 器 
在 命令 行 上 启动 解释 器 ， 你 马上 就 可 以 开始 编写 Python 代码 。 在 Unix, DOS 或 其 它 提 供 命 
令 行 解释 器 或 shell 窗口 的 系统 中 ， 都 可 以 这 么 做 。 学 习 Python 的 最 好 方法 就 是 在 交互 式 解 





























dim 





|[e— —o— 一 全 


Edit By Vheavens 








Edit By Vheavens 








释 器 中 练习 。 在 你 需要 体验 Python 的 一 些 特性 时 ， 交互 式 解释 器 也 非常 有 用 。 





Unix 衍生 系统 (Linux, MacOS X, Solaris, FreeBSD 等 等 ) 
要 访问 Python, 除非 你 已 经 将 Python 所 在 路 径 添加 到 系统 搜索 路 径 之 中 ， 否则 就 必须 
输入 Python 的 完整 路 径 名 才 可 以 启动 Python。.Python 一 般 安装 在 /usr/bin BK/usr/local/bin 
子 目录 中 。 

我 们 建议 读者 把 Python (python 执行 文件 ， 或 Jython 执行 文件 一 一 如 果 你 想 使 用 Java 版 
的 解释 器 的 话 ) 添加 到 你 的 系统 搜索 路 径 之 中 ， 这 样 你 只 需要 输入 解释 器 的 名 字 就 可 以 启动 
Python 解释 器 了 ， 而 不 必 每 次 都 输入 完整 路 径 。 
要 将 Python 添加 到 搜索 路 径 中 ， 只 需要 检查 你 的 登录 启动 脚本 ， 找到 以 set path 或 
PATH= 指令 开始 ， 后 面 跟着 一 串 目录 的 那 行 ， 然后 添加 解释 器 的 完整 路 径 。 所 有 事情 都 做 完 之 
后 ， 更 新 一 下 shell 路 径 变量 。 现 在 在 Unix 提示 符 (根据 shell 的 不 同 可 能 是 2% ”或 “4 和) 
处 键入 python (或 jython) 就 可 以 启动 解释 器 了 ， 如 下 所 示 : 









































$ python 





T 





Python 启动 成 功 之 后 ， 你 会 看 到 解释 器 启动 信息 ， 表 明 Python 的 版 本 号 及 平台 信息 ， 
最 后 显示 解释 器 提示 符 “>>>” 等 待 你 输入 Python 命令 。 


Windoes/DOS 环境 








为 了 把 Python 添加 到 搜索 路 径 中 ， 你 需要 编辑 C:\autoexec. bat 文件 并 将 完整 的 
Python 安装 路 径 添 加 其 中 。 这 通常 是 C:\Python 或 C:\Program Files \Python ( 或 是 
“Program Files” Æ DOS 下 的 简写 名 字 C:\Progra 1\Python) 
要 想 在 DOS 中 将 Python 添加 到 搜索 路 径 中 去 ， 需 要 编辑 C:\autoexec. bat 文件 ,把 Python 
的 安装 目录 添加 上 去 。 一 般 是 C:\Python E C:\Program Files\Python (或 者 它 在 DOS 中 的 简写 
名 字 C:\Progra 1\Python). 在 一 个 DOS 窗口 中 ( 它 可 以 是 纯 DOS 环境 或 是 在 Windows 中 的 启动 
的 一 个 DOS 窗口 ) 启动 Python 的 命令 与 Unix 操作 系统 是 一 样 的 都 是 “python”: 它们 唯一 
的 区 别 在 于 提示 符 不 同 ， D0S 中 是 C:\> 如 下 图 所 示 : 











1-1 在 一 个 UNIX (MacOS X) 环境 中 启动 Python 时 的 屏幕 画面 。 


E 
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eoo Terminal — bash 一 ttyp3 — 80x25 一 %3 

myMac:^ wesc$ 
myMac:~ wesc$ python 

Python 2.4 (#4, Mar 19 2005, 03:25:10) 

[ccc 3.3 20030304 (Apple Computer, Inc. build 1671)] on darwin 

Type "help", "copyright", "credits" or "license" for more information. 
>>> 

>>> print 'Hello World!' 

Hello World! 

>>> 

>>> import sys 

>>> sys.stdout .write('Hello World! \n') 

Hello World! 

>>> 

myMac:^ wesc$ || 








EN «i €3 


C:\> python 


命令 行 选 项 
当 从 命令 行 启动 Python 的 时 候 ， 可 以 给 解释 器 一 些 选 项 。 这 里 有 部 分 选项 可 供 选 择 : 


-d 提供 调试 输出 

-0 生成 优化 的 字 节 码 〈 生 成 .pyo 文件 ) 

-S 不 导入 site 模块 以 在 启动 时 查找 Python 路 径 
Sy 元 余 输 出 (导入 语句 详细 追踪 ) 

-m mod 将 一 个 模块 以 脚本 形式 运行 

-Q opt ”除法 选项 (参阅 文档 ) 

-c cmd ”运行 以 命令 行 字符 串 形式 提交 的 Python 脚本 
file ”从 给 定 的 文件 运行 Python 脚本 (参阅 后 文 ) 


1 一 2 在 一 个 D0S/ 命 令 行 窗口 启动 Python 


dim 
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c« MS-DOS -iof x} 


icrosoft Windows XP [Version 5.1.260801 
<C) Copyright 1985-2661 Microsoft Corp. 


=\WINDOWS\s ys tem32 >pytho 
ython 2.4.2 (67. Sep 28" 2085. 12:41: 11> [MSC y- 1318 32 bit 《Intel>] on win32 
Type "help". copyrighe", "credits" or "license" for more information. 


>>> print 'Hello World?’ 
ello World! 
>>> ^Z 





=\WINDOWS\s ystem32> 





Figure 1-2 Starting Python in a DOS/command window 
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Unix 衍生 系统 (Linux, MacOS X, Solaris, FreeBSD 等 等 ) 


不 管 哪 种 Unix FE, Python 脚本 都 可 以 象 下 面 这 样 ， 在 命令 行 上 通过 解释 器 执行 





4 





$ python script. py 





Python 脚本 使 用 扩展 名 .py， 上 面 的 例子 也 说 明了 这 一 点 。 Unix 平台 还 可 以 在 不 明确 指 
XE Python 解释 器 的 情况 下 ， 自 动 执 行 Python 解释 器 。 如 果 你 使 用 的 是 类 Unix 平台 ， 你 可 以 
在 你 的 脚本 的 第 一 行使 用 shell 魔术 字符 串 (“sh-bang”) : 





#!/usr/local/bin/python 


在 #! 之 后 写 上 Python 解释 器 的 完整 路 径 ， IRMA M SARE), Python 解释 器 通常 
在 /usr/local/bin 或 /usr/bin 目录 下 .如果 Python 没有 安装 到 那里 ， 你 就 必须 确认 你 的 


Python 解释 器 确实 位 于 你 指定 的 路 径 。 错 误 的 路 径 将 导致 出 现 类 似 于 ” 找 不 到 命令 “的 错误 信 
E 


ay 

















有 一 个 更 好 的 方案 ， 许多 Unix 系统 有 一 个 命令 叫 env， 位 于 /bin 或 /usr/bin 中 。 它 
会 帮 你 在 系统 搜索 路 径 中 找到 python 解释 器 。 如 果 你 的 系统 拥有 env， 你 的 启动 行 就 可 以 改 
为 下 面 这 样 : 
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#!/usr/bin/env python 


或 者 ， 如 果 你 的 env 位 于 /bin 的 话 ， 


#!/bin/env python 








当 你 不 能 确定 Python 的 具体 路 径 或 者 Python 的 路 径 经 常 变 化 时 〔 但 不 能 挪 到 系统 搜索 路 
径 之 外 ) ， env 就 非常 有 用 。 当 你 在 你 的 脚本 首 行书 写 了 合适 的 启动 指令 之 后 ， 这 个 脚本 就 
能 够 直接 执行 。 当 调用 脚本 时 ， 会 先 载 入 Python 解释 器 ， 然 后 运行 你 的 脚本 。 我 们 刚才 提 到 ， 
这 样 就 不 必 显 式 的 调用 Python 解释 器 了 ， 而 你 只 需要 键入 脚本 的 文件 名 : 






































$ script. py 











TER, 在 键入 文件 名 之 前 ， 必须 先 将 这 个 文件 的 属性 设置 为 可 以 执行 。 在 文件 列表 中 ， 
你 的 文件 应 该 将 它 设置 为 自己 拥有 rwx 权限 。 如 果 在 确定 Python 安装 路 径 ， 或 者 改变 文件 权 
限 ， 或 使 用 chmod 命令 时 遇 到 困难 ， 请 和 系统 管理 员 一 道 检 查 一 下 。 






































Windows/DOS 环境 





DOS 命令 窗口 不 支持 自动 执行 机 制 ， 不 过 至 少 在 WinXP 当中 ， 它 能 象 在 Windows 中 一 样 
做 到 通过 输入 文件 名 执行 脚本 : 这 就 是 “文件 类 型 ”接口 。 这 个 接口 允许 Windows 根据 文件 扩 
展 名 识别 文件 类 型 ， 从 而 调用 相应 的 程序 来 处 理 这 个 文件 。 举 例 来 说 ， 如 果 你 安装 了 带 有 
PythonWin 的 Python, 双击 一 个 带 有 .py 扩展 名 的 Python 脚本 就 会 自动 调用 Python 或 
PythonWin IDE( 如 果 你 安装 了 的 话 ) 来 执行 你 的 脚本 。 运行 以 下 命令 就 和 双击 它 的 效果 一 样 : 




















C: |^ script. py 





这 样 无 论 是 基于 Unix 操作 系统 还 是 Win32 操作 系统 都 可 以 无 需 在 命令 行 指 定 Python 
解释 器 的 情况 下 运行 脚本 ， 但 是 如 果 调 用 脚本 时 ， 得 到 类 似 “ 命 令 无 法 识别 ”之 类 的 错误 提示 
信息 ， 你 也 总 能 正确 处 理 。 
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你 也 可 以 从 图 形 用 户 界面 环境 运行 python， 你 所 需要 的 是 支持 Python 的 GUI 程序 。 如 
果 你 已 经 找到 了 一 个 ， 很 有 可 能 它 恰好 也 是 集成 开发 环境 。 集 成 开发 环境 不 仅仅 是 图 形 接口 ， 
通常 会 带 有 源 代码 编辑 器 、 追 踪 和 排 错 工具 。 














Unix 衍生 系统 (Linux, MacOS X, Solaris, FreeBSD 等 等 ) 


IDLE 可 以 说 是 Unix FS F Python 的 第 一 个 集成 开发 环境 CIDE) 。 最 初版 本 的 IDLE 也 是 
贵 铎 。 范 。 罗 萨 姆 开发 的 ， 在 Pythonl.5.2 中， 它 首次 露面 。IDLE 代表 的 就 是 IDE, 只 不 过 
多 了 一 个 “L”。 我 猜测 ，IDLE 是 借用 了 “ 蒙 提 “。 派 森 ”一 个 成 员 的 名 字 DEREI1)...WH...... 
IDLE 基于 Tkinter， 要 运行 它 的 话 你 的 系统 中 必须 先 安装 Tc1/Tk ， 目 前 的 Python 发 行 版 都 带 
有 一 个 迷你 版 的 Tcl/Tk BE. 因此 就 不 再 需要 Tcl/Tk 的 完整 安装 了 。 

















如 果 你 已 经 在 系统 中 安装 好 了 Python, 或 者 你 有 一 个 “Python RPM&, 可 是 它 并 没有 包 
含 IDLE 或 Tkinter, 那 在 你 尝试 IDLE 之 前 ， 必须 先 将 这 两 样 东 西安 装 好 。 (如果 你 需要 ， 
确实 有 一 个 独立 的 Tkinter RPM 包 可 以 供 你 下 载 ， 以 便 和 Python 一 起 工作 ) 如果 你 是 自己 编 
VERY Python, WHA Tk 库 可 用 ， 那 Tkinter 会 自动 编译 进 Python， 而 且 Tkinter 和 IDLE 
也 会 随 Python 的 安装 而 安装 。 






































如 果 你 打算 运行 IDLE， 就 必须 找到 你 的 标准 库 安 装 位 置 : 
/usr/local/lib/python2.x/idlelib/idle.py. 如 果 你 是 自己 编译 Python， 你 会 在 
/usr/local/bin 目录 中 发 现 一 个 名 为 idle 的 脚本 ， 这样 你 就 可 以 在 shell 命令 行 中 直接 运行 
idle. 1 一 3 是 类 Unix 系统 下 的 IDLE FLT. MacOS X 是 一 个 非常 类 似 Unix (基于 mach 内 核 ， 
BSD 服务 ) 的 操作 系统 。 在 MacOS X F, Python 可 以 用 传统 的 Unix 编译 工具 编译 。Mac0S X 
发 行 版 自 带 一 个 编译 好 的 Python 解释 器 ， 不 过 并 没有 任何 一 个 面向 Mac 的 特殊 工具 。 “比如 
GNU readline, IDE 等 等 ) 。 当然 也 没有 Tkinter 和 IDLE. 











你 可 能 会 打算 自己 下 载 并 编译 一 个 出 来 ， 不 过 要 小 心 一 点 ， 有 时 你 新 安装 的 Python 会 与 
Apple 预 装 的 版 本 混淆 在 一 起 。 认 真一 点 没有 坏处 。 你 也 可 以 通过 Fink/Finkcommander 和 
DarwinPorts 得 到 MacOS X 版 的 Python: 











http: //fink. sourceforge. net/ 
http: //darwinports. org 


E 





* 
e 
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如 果 要 得 到 最 新 Mac 版 Python 的 组 建 和 信息 ， 请 访问 : 
http: //undefined. org/python http://pythonmac. org/packages 





1-3 在 Unix 中 启动 IDLE 


[BG [E] Python Sheil Lu 
File Edit Shell Debug Options Windows 


| Python 2.4 (#4, Mar 19 2005, 03:25:10) 
| [ecc 3.3 20030304 (Apple Computer, Inc. build 1671)] on darwin 
Type "copyright", "credits" or "license()" for more information. 


大大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 二 大 大 大 大 大 二 大 大 大 大 二 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 二 大 大 大 
Personal firewall software may warn about the connection IDLE 
makes to its subprocess using this computer's internal loopback 
interface. This connection is not visible on any external 
interface and no data is sent to or received from the Internet. 
赤 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大 大大 大 大 大 大 大 


| IDLE 1.1 


|» 








另 一 个 选择 是 从 Python 站 点 下 载 MacOS X. 的 通用 二 进 制 包 。 这 个 磁盘 映像 文件 (DMG) 要 求 
操作 系统 版 本 至 少 为 10. 3. 9， 它 适 用 于 基于 PowerPC 和 Intel 硬件 的 Mac 机 器 。 


Windows 环境 


PythonWin 是 Python 的 第 一 个 Windows 接口 , 并 且 还 是 个 带 有 图 形 用 户 界 面 的 集成 开发 
环境 。PythonWin 发 行 版 本 中 包含 Windows API 和 COM 扩展 。PythonWin 本 身 是 针对 MFC 库 编 写 
的 ， 它 可 以 作为 开发 环境 来 开发 你 自己 的 Windows 应 用 程序 。 你 可 以 从 下 面 给 出 的 网 页 中 下 载 
并 安装 它 。 





PythonWin 通常 被 安装 在 和 Python 相同 的 目录 中 ， 在 它 自 己 的 安装 目录 
C:\Python2x\Lib\site-packages\pythonwin 中 有 可 执行 的 启动 文件 pythonwin. exe o 
PythonWin 拥有 一 个 带 有 颜色 显示 的 编辑 器 、 一 个 新 的 增强 版 排 错 器 、 交 互 shell 窗口 、COM 扩 
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展 和 更 多 的 有 用 特性 。 如 图 1 - 4 就 是 运行 在 Windows 上 的 PythonWin 集成 开发 环境 的 屏幕 截图 。 





PythonWin 


» Interactive Window 
Pythonwin 1.6a2 (#0, Apr 6 2000, 11:45:12) [MSC 32 bit (Intel)] on win32 
Copyright 1991-1995 Stichting Mathematisch Centrum, Amsterdarn 

Portions Copyright 1994-2000 Mark Hammond (MHammond@skippinet.com.au 


>>> 





Sj friends.py 


W'/usr/bin/env python 


import cgi 
from urllib import quote plus 
from string import capwords 


# showForm() --> None 
-def showForm(who, howmany): 
'showFormí) -- presents blank or data-filled foi 
friends = '' 
for i in [0, 10, 25, 50, 100]: 
checked = '' 








图 1 - 4 Windows 环 境 中 的 PythonWin 





你 可 以 在 下 面 由 马克 。 哈 蒙 德 (Mark Hammond) 维护 的 网 站 中 找到 更 多 的 关于 PythonWin 


和 Python 针对 Windowns 的 扩展 〈 也 被 称 作 “win32al11”) : 


http://starship. python. net/crew/mhammond/win32/ 
http://sourceforge. net/projects/pywin32/ 


http://starship. python. net/crew/mhammond/win32/ 
http: //sourceforge. net/pro jects/pywin32/ 


IDLE 也 有 Windows 平台 版 本 ,这 是 由 Tcl/ Tk 和 Python/ Tkinter 的 跨 平台 性 特点 决定 的 ， 


它 看 上 去 很 像 Unix 平台 下 的 版 本 ， 如 图 1 - 5 所 示 。 
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fr Windows FS F, IDLE 可 以 在 Python 编译 器 通常 所 在 的 目录 C: Python2x 下 的 子 目 录 
Lib\idlelib 中 找到 。 从 DOS 命令 行 窗口 中 启动 IDLE， 请 调用 idle. py。 你 也 可 以 从 Windows 
环境 中 调用 idle. py， 但 是 会 启动 一 个 不 必要 的 DOS 窗口 。 取 而 代 之 的 方法 是 双击 idle. pyw, 
以 . pyw 作为 扩展 名 的 文件 不 会 通过 打开 DOS 命令 行 窗口 来 运行 脚本 。 事 实 上 你 可 以 在 桌面 上 创 
建 一 个 到 C: \Python2x\Lib\idlelib\idle. pyw 的 快捷 方式 ， 然 后 双击 启动 就 可 以 了 ， 简 单 吧 ! 

















Python Shell -iol x| 
File Edit Shel Debug Options Windows Help 





Python 2.4.2 (H67, Sep 28 2005, 12:41:11) [MSC v.1310 32 bit (Intel)] on win32 a 
Type "copyright", "credits" or "license()" for more information. 


FI II III III III TI TI TTT TT TT TOT TTT TAT TTA TT AAA e AAA 
Personal firewall software may warn about the connection IDLE 
makes to its subprocess using this computer's internal loopback 
interface. This connection is not visible on any external 
interface and no data is sent to or received from the Internet. 
FI II III TIT TTT TTA TT TT TA AAA ATA AAA 


IDLE 1.1.2 

>>> 

>>> print 'Hello World!' 
Hello World! 

>>> 


Ln: 15|Col: 4 





Figure 1-5 Starting IDLE in Windows 


1.5.4 其 它 的 集成 开发 环境 和 执行 环境 


很 多 的 软件 开发 专家 事实 上 会 选择 在 他 们 喜欢 的 文本 编辑 器 中 编写 代码 ， 比 如 vi tm) 或 者 
emacs。 除 了 这 些 和 上 面 提 到 到 的 集成 开发 环境 ， 还 有 大 量 的 开源 和 商业 的 集成 开发 环境 ， 下 面 
是 个 简短 的 列表 : 





开源 
e IDLE (在 Python 发 行 版 中 自 带 ) 


© 
e 
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http: //python. org/idle/ 

€ PythonWin + Win32 Extensions 
http://starship. python. net/crew/skippy/win32 

e IPython (增强 的 交互 式 Python) 

http://ipython. scipy. org 

e IDE Studio (IDLE 以 及 更 多 ) 

http://starship. python. net/crew/mike/Idle 

€ Eclipse 

http: //pydev. sf. net 

http: //eclipse. org/ 














商业 
@ WingWare 开发 的 WingIDE Python 集成 开发 环境 
http://wingware. com/ 








€ ActiveState JT 发 的 Komodo E 成 开发 X^» X 
. http://activestate. com/Products/Komodo 
通用 集成 开发 环境 列表 


http://wiki. python. org/moin/IntegratedDevelopmentEnvironments 





核心 提示 : 运行 本 书 中 的 代码 实例 

在 本 书 中 ， 你 会 发 现 很 多 的 Python 脚本 样 例 ， 可 以 从 本 书 的 网 站 上 下 载 。 但 是 当 你 运行 它 
们 的 时 候 ， 请 记 住 这 些 代码 是 设计 用 来 从 命令 行 CDOS 命令 行 窗 口 或 Unix shell) 或 者 集成 开 
发 环境 执行 的 。 如 果 你 在 使 用 Win32 系统 ， 双 击 Python 程序 会 打开 DOS HA, 但 是 在 脚本 执行 
完毕 后 就 会 关闭 , 所 以 你 可 能 看 不 到 输出 结果 。 如 果 你 遇 到 了 这 种 情况 , 就 直接 打开 DOS 窗口 ， 
从 命令 行 中 运行 相关 的 脚本 ， 或 者 在 集成 开发 环境 中 执行 脚本 。 另 外 一 种 办 法 ， 就 是 在 脚本 的 
最 后 一 行 后 面 添加 raw. input 0 语句， 这 样 就 可 以 保持 窗口 开 着 ， 直 到 你 按 下 回 车 键 才 关 闭 。 


























1.6 Python 文档 
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Python 文档 可 以 在 很 多 地 方 找 到 。 最 便捷 的 方式 就 是 从 Python 网 站 查看 在 线 文档 。 如 果 
你 没 上 网 ， 并 且 使 用 的 是 Win32 系统 ， 那 么 在 C:\Python2x\Doc\ 目 录 下 会 找到 一 个 名 为 
Python2x. chm 的 离线 帮助 文档 。 它 使 用 IE 接口 , 所 以 你 实际 上 是 使 用 网 页 浏览 器 来 查看 文档 。 
其 他 的 离线 文档 包括 PDF 和 PostScript (PS) 文 件 。 最 后 ， 如 果 你 下 载 了 Python 发 行 版 ， 你 会 
得 到 LaTeX 格式 的 源 文件 。 








在 本 书 的 网 站 中 ， 我 们 创建 了 一 个 包括 绝 大 多 数 Python 版 本 的 文档 ， 只 要 访问 
http://corepython. com， 单 击 左 侧 的 “Documentation” 就 可 以 了 。 





1.7 比较 Python (Python 与 其 他 语言 的 比较 ) 


Python 已 经 和 很 多 语言 比较 过 了 。 一 个 原因 就 是 Python 提供 了 很 多 其 他 语言 拥有 的 特性 。 
另外 一 个 原因 就 是 Python 本 身 也 是 由 诸多 其 他 语言 发 展 而 来 的 ， 这 包括 ABC. Modula-3. C. 
C++, Algol-68, SmallTalk, Unix shell 和 其 他 的 脚本 语言 等 等 。Python 就 是 ”浓缩 的 精华 


























". 范 。 罗 了 萨 姆 研究 过 很 多 语言 ， 从 中 吸收 了 许多 觉得 不 错 的 特性 ， 并 将 它们 溶 于 一 炉 。 


然而 , 往往 因为 Python 是 一 门 解释 型 语言 , 你 会 发 现 大 多 数 的 比较 是 在 Perl. Java, Tcl, 

还 有 JavaScript 之 间 进 行 的 。Perl 是 男 外 一 种 脚本 语言 ， 远 远 超越 了 标准 的 shell 脚本 。 像 
Python 一 样 ，Perl 赋予 了 你 所 有 编程 语言 的 功能 特性 ， 还 有 系统 调用 能 

Perl 最 大 的 优势 在 于 它 的 字符 串 模式 匹配 能 力 ， 其 提供 了 一 个 十 分 强大 的 正则 表达 式 匹 配 
引擎 。 这 使 得 Perl 实际 上 成 为 了 一 种 用 于 过 滤 、 识 别 和 抽取 字符 串 文 本 的 语言 ， 而 且 它 一 直 是 
开发 Web 服务 器 端 CGI (common gateway interface, 通用 网 关 接 口 ) 网 络 程序 的 最 流行 的 语言 。 
Python 的 正则 表达 式 引 擎 很 大 程度 上 是 基于 Perl 的 。 

SRT, Perl 语言 的 了 临 涩 和 对 符号 语法 的 过 度 使 用 ， 让 解读 变 得 很 困难 。 这 些 语法 令 初学 者 
不 得 精 要 ， 为 他 们 的 学 习 带 来 了 不 小 的 阻碍 。Per1l 的 这 些 额 外 的 “特色 ”使 得 完成 同一 个 任务 
会 有 多 个 方法 , 进而 引起 了 开发 者 之 间 的 分 靶 和 内 这 。 最 后 , 通常 当 你 想 阅 读 几 个 月 前 写 的 Perl 
脚本 的 时 候 都 不 得 不 求助 参考 书 。 

Python 也 经 常 被 拿 来 和 Java 作对 比 ， 因 为 他 们 都 有 类 似 的 面向 对 象 的 特性 和 语法 。Java 
的 语法 尽管 比 C+t+ 简 单 的 多 , 但 是 依旧 有 些 繁琐 , 尤其 是 当 你 想 完成 一 个 小 任务 的 时 候 。Python 
的 简洁 比 纯粹 的 使 用 Java 提供 了 更 加 快速 的 开发 环境 。 在 Python 和 Java 的 关系 上 , 一 个 非常 
重大 的 革命 就 是 Jython 的 开发 。Jython 是 一 个 完全 用 Java 开发 的 Python 解释 器 ， 现 在 可 以 
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在 只 有 Java 虚拟 机 的 环境 中 运行 Python 程序 。 我 们 会 在 后 面 的 章节 中 简单 讲述 Jython 的 更 多 
优点 ， 但 是 现在 就 可 以 告诉 你 : 在 Jython 的 脚本 环境 中 ， 你 可 以 熟练 地 处 理 Java 对 象 ，Java 
可 以 和 Python 对象 进行 交互 ， 你 可 以 访问 自己 的 Java 标准 类 库 ， 就 如 同 Java 一 直 是 Python 
环境 的 一 部 分 一 样 。 




















现在 ， 由 于 Rails 项 目的 流行 ，Python 也 经 常 被 拿 来 和 Ruby 进行 比较 。 就 像 前 面 我 们 提 
BAY, Python 是 多 种 编程 范式 的 混合 ， 它 不 像 Ruby 那样 完全 的 面向 对 象 ， 也 没有 像 Smalltalk 
那样 的 块 ,而 这 正 是 Ruby 最 引 人 注 目的 特性 .Python 有 一 个 字 节 码 解 释 器 ,而 Ruby 没有 。Python 
更 加 易 读 ， 而 Ruby 事实 上 可 以 看 作 是 面向 对 象 的 Per1。 相 对 于 Rails, Python 有 几 个 自己 的 
Web 应 用 框架 ， 比 如 Django 和 Turbogears 这 两 个 项 目 。 

















Tcl 是 另 一 种 可 以 与 Python 相提并论 的 脚本 语言 。Tcl 是 最 易于 使 用 的 脚本 语言 之 一 ， 程 

序 员 很 容易 像 访问 系统 调用 一 样 对 Tel 语言 进行 扩展 。Tcl 直到 今天 仍然 很 流行 ， 与 Python 
HE, 它 或 许 有 更 多 局 限 性 《主要 是 因为 它 有 限 的 几 种 数据 类 型 ) ， 不 过 它 也 拥有 和 Python 

一 样 的 通过 扩展 超越 其 原始 设计 的 能 力 。 更 重要 的 是 ， Tcl 通常 总 是 和 它 的 图 形 工具 包 Tk 一 
. 起 工作 ， 一 起 协同 开发 图 形 用 户 界 面 应 用 程序 。 因 为 它 非常 流行 ， 所 以 Tk 已 经 被 移植 到 


























Perl (Per1/Tk) 和 Python (Tkinter) 中 ， 同 样 有 一 个 有 争议 的 观点 ， 那 就 是 与 Tol ALK, 因为 
Python 有 类 ， 模块 及 包 的 机 制 ， 所 以 写 起 大 程序 来 更 加 得 心 应 手 。 











Python 有 一 点 点 函数 化 编程 (functional programming , FP) 结构 ， 这 使 得 它 有 点 类 似 
List 或 Scheme 语言 。 尽管 Python 不 是 传统 的 函数 化 编程 语言 ， 但 它 持续 的 从 Lisp 和 haskell 
语言 中 借用 一 些 有 价值 的 特性 。 举 例 来 说 ， 列表 解析 就 是 一 个 广 受 欢迎 的 来 自 Haskell 世界 的 
特性 ， 而 Lisp 程序 员 在 遇 到 lambda, map, filter 和 reduce 时 也 会 感到 异常 亲切 。 


























JavaScript 是 另外 一 种 非常 类 似 Python 的 面向 对 象 脚 本 语言 。 优 秀 的 JavaScript 程序 员 
学 起 Python 来 易如反掌 。 聪慧 的 读者 会 注意 到 JavaScript 是 基于 原型 系统 的 ， 而 Python 则 
遵循 传统 的 面向 对 象 系统 ， 这 使 得 二 者 的 类 和 对 象 有 一 些 差异 。 














下 面 列 出 了 有 关 Python 与 其 它 语言 进行 比较 的 网 页 : 





Perl 
http: //www2. linux journal. com/article/3882 
http://llama. med. harvard. edu/^ fgibbons/PerlPythonPhrasebook. html 
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http: //aplawrence. com/Unixart/pythonvsperl. html 
http: //pleac. sf. net/pleac python 








http://www. garshol. priv. no/download/text/perl.html 


Java 

http://dirtsimple. org/2004/12/python-is-not- java. html 
http://twistedmatrix. com/users/glyph/rant/python-vs- java. html 
http: //netpub. cstudies. ubc. ca/oleary/python/python java comparison. php 


Lisp 
http://strout. net/python/pythonvslisp. html http: //norvig. com/python-lisp. html 


Ruby 
http: //blog. ianbicking. org/ruby-python-power. html 
http://www. rexx. com/ oinkoink/Ruby v Python. html 
http: //dev. rubycentral. com/faq/rubyfaq-2. html 


Perl, C++ 


http: //strombergers. com/python/ 


Perl, Java, C++ 
http://furryland. org/ mikec/bench/ 


C++, Java, Ruby 
http://dmh2000. com/c jpr 


Perl, Java, PHP, Tcl 
http: //www-128. ibm. com/developerworks/linux/library/l-pythonlOl.html 


http://www-128. ibm. com/developerworks/linux/library/l-script-survey/ 


C, C++, Java, Perl, Rexx, Tcl 
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http://www. ubka. uni-karlsruhe. de/indexer-vvv/ira/2000/5 





你 可 以 在 下 面 的 网 址 中 看 到 更 多 Python 与 其 他 的 语言 的 比较 : 
http://www. python. org/doc/Compari sons. html 


1. 8 其 它 实现 


标准 版 本 的 Python 是 用 C 来 编译 的 ， 又 叫 CPython， 除 此 之 外 ， 还 有 一 些 其 它 的 Python 
实现 。 我 们 将 在 下 面 讲述 些 实现 ， 除了 本 书 中 提 到 的 这 些 实现 以 外 ， 下 面 的 网 址 还 有 更 多 的 
实现 版 本 : 

http://python. org/dev/implementations. html 


Java 
我 们 在 上 一 节 中 曾经 提 到 ， 还 有 一 个 可 以 用 的 Python 解释 器 是 完全 由 Java 写成 的 ， 名 
A Jython. 尽管 两 种 解释 器 之 间 存 在 一 些 细微 的 差别 ， 但 是 它们 非常 接近 ， 而 且 启 动 环 








境 也 完全 相同 。 那 Jython 又 有 哪些 优势 呢 ? Jython... 





只 要 有 Java 虚拟 机 ， 就 能 运行 Jython 

拥有 访问 Java 包 与 类 库 的 能 

为 Java 开发 环境 提供 了 脚本 引擎 

能 够 很 容易 的 测试 Java 类 库 

提供 访问 Java 原生 异常 处 理 的 能 

继承 了 JavaBeans 特性 和 内 省 能 

鼓励 Python 到 Java 的 开发 (反之 亦 然 ) 

GUI 开发 人 员 可 以 访问 Java 的 AWT/Swing PE 

利用 了 Java 原生 垃圾 收集 器 (CPython 未 实现 此 功能 





























对 Jython 进行 详细 论述 ， 超 出 了 本 文 的 范围 。 不 过 网 上 有 非常 多 的 Jython 信息 。Jython 
目前 仍然 在 不 断 开发 之 中 ， 不 时 会 增加 新 的 特性 。 你 可 以 通过 访问 Jython 的 网 站 得 到 更 多 有 
用 的 信息 : 
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. NET/Mono 


现在 已 经 有 一 个 名 为 IronPython 的 Python 实现 ， 它 是 用 CR 语言 完成 的 . 它 适用 的 环 
境 是 .NET 和 Mono， 你 可 以 在 一 个 .NET 应 用 程序 中 整合 IronPython 解释 器 来 访问 .NET 
对 象 . IronPython 的 扩展 可 以 用 C# 或 VB.NET 语言 编写 ， 除 此 之 外 ， 还 有 一 种 名 为 Boo 
的 .NET/Mono 语言 .你 可 以 在 下 面 的 网 址 获得 更 多 关于 IronPython 和 Boo 语言 的 信息 . 

http://codeplex. com/Wiki/View. aspx?ProjectName=IronPython 

http://boo. codehaus. org/ 





http: // jython. org 





Stackless 

CPython 的 一 个 局 限 就 是 每 个 Python 函数 调用 都 会 产生 一 个 C 函数 调用 . (从 计算 机 科学 的 角度 来 说 ， 我 
们 在 讨论 栈 帧 )， 这 意味 着 同时 产生 的 函数 调用 是 有 限制 的 ， 因 此 Python 难以 实现 用 户 级 的 线程 库 和 复杂 
归 应 用 ， 一 旦 超越 这 个 限制 ， 程 序 就 会 月 溃 你 可 以 通过 使 用 一 个 “stackless” ff) Python 实现 来 突破 
这 个 限制 ， 一 个 C 栈 帧 可 以 拥有 任意 数量 的 Python 栈 帧 . 这样 你 就 能 够 拥有 几乎 无 穷 的 函数 调用 ， 并 能 
文 持 巨大 数量 的 线程 . 这 个 Python 实现 的 名 字 就 叫 '…… .Stackless (嘿嘿 ， 很 惊讶 吗 ?1) 

































































































































































Stackless 唯一 的 问题 就 是 它 要 对 现 有 的 _CPython 解释 器 做 重大 修改 ， 所 以 它 几乎 是 一 
个 独立 的 分 文 ， 另 一 个 名 为 Greenlets 的 项 目 也 支持 微 线 程 ， 它 是 一 个 标准 的 C 扩展 ， 因 此 
不 需要 对 标准 Python 解释 器 做 任何 修改 ， 通 过 以 下 网 址 你 能 了 解 更 多 信息 : 

http://stackless. com http://codespeak. net/py/current/doc/greenlet. html 
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1-1. 安装 Python。 请 检查 Python 是 否 已 经 安装 到 你 的 系统 上 ， 如 果 没 有 ， 请 下 载 并 
安装 它 ! 

1-2. 执行 Python。 有 多 少 种 运行 Python 的 不 同方 法 ?你 喜欢 哪 一 种 ?为 什么 ? 

1-3. Python 标准 库 。 

(a) 请 找到 系统 中 Python 执行 程序 的 安装 位 置 和 标准 库 模块 的 安装 位 置 

(b) 看 看 标准 库 里 的 一 些 文件 ， 比 如 string. py。 这 会 帮助 你 适应 阅读 Python 脚本 。 

1-4. 工交 互 执行 。 启 动 你 的 Python 交互 解释 器 。 你 可 以 通过 输入 完整 的 路 径 名 来 启动 
它 。 当 然 ， 如 果 你 已 经 在 搜索 路 径 中 设置 了 它 的 位 置 ， 那 么 只 输入 它 的 名 字 Cpython 或 者 
python. exe) 就 行 了 。《【 你 可 以 任 选 最 适合 你 的 的 Python 实现 方式 ， 例 如 : 命令 行 、 图 形 用 户 
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接口 /集成 开发 环境 、Jython、IronPython 或 者 Stackless) 启动 界面 看 上 去 就 像 本 章 描 述 的 一 
样 ， 一 旦 你 看 到 >>> 提 示 符 ， 就 意味 着 解释 器 准备 好 要 接受 你 的 Python 命令 了 。 

试 着 输入 命令 print 'Hello World! (然后 按 回 车 键 )， 完 成 著名 的 Hello World! 程 序 ， 
然后 退出 解释 器 。 在 Unix 系统 中 ， 按 下 Ctrl+D 会 发 送 EOF 信号 来 中 止 Python 解释 器 ， 在 DOS 
系统 中 ， 使 用 的 组 合 键 是 Ctrl1+Z。 如 果 要 从 Macintosh、PythonWin、 以 及 Windows 或 Unix 中 
的 IDLE 这 样 的 图 形 用 户 环境 中 退出 ， 只 要 简单 的 关闭 相关 窗口 就 可 以 了 。 























1-5. 编写 脚本 。 作 为 练习 1-4 的 延续 ， 创 建 “Hello World!” AY Python 脚本 其 实 和 
上 面 的 交互 性 练习 并 不 是 一 回 事 。 如 果 你 在 使 用 Unix 系统 ， 尝 试 建立 自动 运行 代码 行 ， 这样 你 
就 可 以 在 没有 调用 Pyton 解释 器 的 情况 下 运行 程序 了 。 

1-6. 编写 脚本 。 使 用 print 语句 编写 脚 本 在 屏幕 上 显示 你 名 字 、 人 年 龄 、 最 喜欢 的 颜色 
和 与 你 相关 的 一 些 事情 〈 背 景 、 兴 趣 、 爱 好 等 等 ) 。 
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本 章 主题 
e 介绍 
e 输入 /输出 
e 注释 
e 操作 符 
e 变量 与 赋值 
@ Python 类 型 
e 缩 进 
e 循环 与 条 件 
e 文件 
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Chapter 











熟悉 的 语言 结构 ， 并 立刻 将 Python 付 诸 使 用 。 虽 然 细 节 内 容 会 在 后 续 的 章节 中 逐一 讲解 ， 但 
是 对 整体 的 了 解 可 以 让 你 迅速 融入 到 Python 中 。 阅 读本 章 的 最 好 的 方法 就 是 在 你 的 电脑 上 打 
JF Python 解释 器 ， 演 试 书 中 的 示例 ， 当然 你 也 可 以 随心 所 和 欲 的 自己 做 实验 。 





本 章 将 对 Python 的 主要 特性 做 一 个 快速 介绍 ， 这 样 你 就 可 以 借助 以 前 的 编程 经 验 识别 出 














我 们 已 经 在 第 一 章 和 练习 1 -4 中 介绍 了 如 何 启动 Python 解释 器 ,在 所 有 的 交互 示例 中 ， 
你 会 看 到 Python 的 主 提示 符 ( >>>) 和 次 提示 符 (... )。 主 提示 符 是 解释 器 告诉 你 它 在 等 待 你 
输入 下 一 个 语句 ， 次 提示 符 告 诉 你 解释 器 正在 等 待 你 输入 当前 语句 的 其 它 部 分 。 














Python 有 两 种 主要 的 方式 来 完成 你 的 要 求 : 语句 和 表达 式 〈 函 数 、 算 术 表 达 式 等 ) 。 相 信 
大 部 分 读者 已 经 了 解 二 者 的 不 同 ， 但 是 不 管 怎样 ， 我 们 还 是 再 来 复习 一 下 。 语 句 使 用 关键 字 来 
组 成 命令 ， 类 似 告诉 解释 器 一 个 命令 。 你 告诉 Python 做 什么 ， 它 就 为 你 做 什么 语句 可 以 有 输 
出 ， 也 可 以 没有 输出 。 下 面 我 们 先 用 print 语句 完成 程序 员 们 老生 常 谈 第 一 个 编程 实例 ，Hello 
World: 

















2M» print 'Hello World!’ 
Hello World! 


E 


dim 
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而 表达 式 没有 关键 字 。 它 们 可 以 是 使 用 数学 运算 符 构成 的 算术 表达 式 ， 也 可 以 是 使 用 括号 

调用 的 函数 。 它们 可 以 接受 用 户 输入 ， 也 可 以 不 接受 用 户 输入 ， 有 些 会 有 输出 ， 有 些 则 没有 。 
《在 Python 中 未 指定 返回 值 的 函数 会 自动 返回 None, 等 价 于 NULL) 下 面 举 一 个 例子 ,函数 abs O 

接受 一 个 数值 输入 ， 然 后 输出 这 个 数值 的 绝对 值 : 

2» abs (-4) 

4 

2» abs (4) 

4 

本 章 中 我 们 将 分 别 介绍 语句 和 表达 式 。 我 们 先 来 研究 print 语句 。 























2.1 程序 输出 ，print 语句 及 “Hello World!" 


有 些 语言 ， 比如 C， 通 过 函数 输出 数据 到 屏幕 ， 例 如 函数 printf() 。 然 而 在 Python 和 大 
多 数 解释 执行 的 脚本 语言 ， 使 用 语句 进行 输出 。 很 多 的 shell 脚本 语言 使 用 echo 命令 来 输出 程 


核心 笔记 : 在 交互 式 解释 器 中 显示 变量 的 值 


通常 当 你 想 看 变量 和 内容 时 ， 你 会 在 代码 中 使 用 print 语句 输出 。 不 过 在 交互 式 解释 器 中 ， 

你 可 以 用 print 语句 显示 变量 的 字符 串 表 示 ， 或 者 仅 使 用 变量 名 查看 该 变量 的 原始 值 。 

在 下 面 的 例子 中 , 我们 把 一 个 字符 串 赋 值 给 变量 myString, 先 用 print 来 显示 变量 的 内 容 ， 
之 后 用 变量 名 称 来 显示 。 

2» myString = 'Hello World!’ 

22» print myString 

Hello World! 

22^ myString 

"Hello World!’ 

注意 : 在 仅 用 变量 名 时 ， 输 出 的 字符 串 是 被 用 单 引 号 括 起 来 了 的 。 这 是 为 了 让 非 字符 串 对 
象 也 能 以 字符 串 的 方式 显示 在 屏幕 上 一 一 即 它 显 示 的 是 该 对 象 的 字符 串 表 示 ， 而 不 仅仅 是 字符 
串 本 身 。 引 号 表示 你 刚刚 输入 的 变量 的 值 是 一 个 字符 串 。 等 你 对 Python 有 了 较 深 入 的 了 解 之 后 ， 
你 就 知道 print 语句 调用 str O 函数 显示 对 象 , 而 交互 式 解释 器 则 调用 repr O 函数 来 显示 对 象 。 


2.2 程序 输入 和 raw input () 内 建 函 数 
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下 划 线 O 在 解释 器 中 有 特别 的 含义 , 表示 最 后 一 个 表达 式 的 值 。 所 以 上 面 的 代码 执行 之 后 ， 
下 划 线 变量 会 包含 字 符 囊 ， 

2 

Hello World! 

Python 的 print 语句 ， 与 字符 串 格 式 运 算 符 ( % ) 结 合 使 用 ， 可 实现 字符 串 蔡 换 功 能 ， 这 
一 点 和 C 语言 中 的 printf O 函数 非常 相似 ; 








2» print “%s is number %d!” % (Python, 1) 
Python is number 1! 





%s 表示 由 一 个 字符 串 来 蔡 换 ， 而 %d 表示 由 一 个 整数 来 蔡 换 ， 另 外 一 个 很 常用 的 就 是 %f， 它 
表示 由 一 个 浮 点 数 来 葵 换 。 我 们 会 在 本 章 中 看 到 更 多 类 似 的 例子 。Python 非常 灵活 ， 所 以 即使 
你 将 数字 传递 给 %s， 也 不 会 像 其 他 要 求 严 格 的 语言 一 样 引发 严重 后 果 。 参 阅 章 节 6.4.1 以 了 解 
更 多 关于 字符 串 格 式 运 算 符 的 信息 。Print 语句 也 支持 将 输出 重 定向 到 文件 。 这 个 特性 是 从 
Python2. 0 开始 新 增 的 。 符 号 >> 用 来 重 定 向 输出 ， 下 面 这 个 例子 将 输出 重 定向 到 标准 错误 输 

出 : 


























import sys 
print 22 sys. stderr, 'Fatal error: invalid input!’ 
import sys 

print > sys. stderr, "Fatal error: invalid input!’ 








下 面 是 一 个 将 输出 重 定向 到 日 志文 件 的 例子 : 


logfile = open( /tmp/mylog.txt', 'a^) 
print > logfile, 'Fatal error: invalid input!’ 
logfile.close( 


2.2 程序 输入 和 内 建 函 数 raw_input() 
从 用 户 那里 得 到 数据 输入 的 最 容易 的 方法 是 使 用 raw_input O 内 建 函 数 。 它 读 取 标准 输入 ， 
并 将 读 取 到 的 数据 赋值 给 指定 的 变量 。 你 可 以 使 用 int 0 内 建 函数 将 用 户 输入 的 字符 串 转换 
为 整数 。 














2^ user = raw input( Enter login name: ') 
Enter login name: root 


4 . 
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2» print 'Your login is:', user 
Your login is: root 





上 面 这 个 例子 只 能 用 于 文本 输入 。 FERRA — BUB GERE (并 将 字符 串 转换 为 整数 ) 
的 例子 : 


2» num = raw input( Now enter a number: ') 

Now enter a number: 1024 

2» print 'Doubling your number: %d’ % (int (num) * 2) 
Doubling your number: 2048 














内 建 函 数 int () 将 数值 字符 串 转 换 成 整数 值 ， 这 样 才 可 以 对 它 进行 数 学 运算 。 参 阅 章节 
6.5.3 以 了 解 更 多 有 关内 建 函 数 raw_input O 的 知识 。 











核心 笔记 : 从 交互 式 解 释 器 中 获得 帮助 
在 学 习 Python 的 过 程 中 , 如 果 需 要 得 到 一 个 生 下 函 数 的 帮助 , 只 需要 对 它 调用 内 建 函数 
$ helpO . 。 通 过 用 函数 名 作为 help O 的 参数 就 能 得 到 相应 的 帮助 信息 : E: 


2» help(raw input) 
Help on built-in function raw input in module | builtin : 


raw input(...) 
raw input([prompt]) — string 


从 标准 输入 读 取 一 个 字符 串 并 自动 删除 串 尾 的 换行 字符 。 如 果 用 入 键入 了 EOF 字符 (Unix: 
Ctrl+D, Windows: Ctrl1+Z+ 回 车 ) , 则 引发 EOFError, Æ Unix 平台 ， 只 要 可 用 ， 就 使 用 GNU 
readline 库 。 如 果 提 供 提示 字符 串 参 数 ， 则 显示 该 字符 串 并 自动 删 去 字符 串 末尾 的 换行 字符 。 

(上 面 一 行 是 help (raw input) 的 输出 ， 译 文 是 对 其 加 以 解释 一 一 译 者 注 ) 


核心 风格 : 一 直 在 函数 外 做 用 户 交 互 操作 

新 手 在 需要 显示 信息 或 得 到 用 户 输 入 时 ， 很 容易 想到 使 用 print 语句 和 raw_input () 内 
建 函 数 。 不 过 我 们 在 此 建议 函数 应 该 保持 其 清晰 性 ， 也 就 是 它 只 应 该 接受 参数 ， 返 回 结果 。 从 
用 户 那 里 得 到 需要 的 数据 ， 然 后 调用 函数 处 理 ， 从 函数 得 到 返回 值 , 然后 显示 结果 给 用 户 。 这 
样 你 就 能 够 在 其 它 地 方 也 可 以 使 用 你 的 函数 而 不 必 担 心 自 定 义 输出 的 问题 。 这 个 规则 的 一 个 例 
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外 是 ， 如 果 函 数 的 基本 功能 就 是 为 了 得 到 用 户 输出 ， 或 者 就 是 为 了 输出 信息 ， 这 时 在 函数 体 使 
用 print 语句 或 raw_inputQ 也 未 尝 不 可 。 更 重要 的 ， 将 函数 分 为 两 大 类 ， 一 类 只 做 事 ， 不 
需要 返回 值 ( 比 如 与 用 户 交 互 或 设置 变量 的 值 ) ， 男 一 类 则 执行 一 些 运算 ,最 后 返回 结果 。 如 
果 输 出 就 是 函数 的 目的 ， 那 么 在 函数 体内 使 用 print 语句 也 是 可 以 接受 的 选择 。 






































2.3 注释 


和 大 部 分 脚本 及 Unix-shell 语言 一 样 ，Python 也 使 用 # 符号 标示 注释 ， 从 # 开始 ， 直 
到 一 行 结束 的 内 容 都 是 注释 。 
22^ # one comment 
. print “Hello World!’ # another comment 
Hello World! 


有 一 种 叫做 文档 字符 串 的 特别 注释 。 你 可 以 在 模块 、 类 或 者 函数 的 起 始 添 加 一 个 字符 串 ， 
起 到 在 线 文档 的 功能 ， 这 是 Java 程序 员 非 常熟 悉 的 一 个 特性 。 

def foo(): 

“This is a doc string. ^ 








return True 
+ 与 普通 注释 不 同 ， 文 档 字符 串 可 以 在 运行 时 访问 ， 也 可 以 用 来 自动 生成 文档 。 k 
2.4 运算 符 

和 其 他 绝 大 多 数 的 语言 一 样 ，Python 中 的 标准 算术 运算 符 以 你 熟悉 的 方式 工作 
十 一 * / // % xk 
加 、 减 、 乘 、 除 和 取 余 都 是 标准 运算 符 。Python 有 两 种 除法 运算 符 ,， 单 斜 杠 用 作 传 统 除 法 ， 

双 斜 杠 用 作 浮 点 除法 (对 结果 进行 四 舍 五 入 ) 。 传 统 除法 是 指 如 果 两 个 操作 数 都 是 整数 的 话 ， 

它 将 执行 是 地 板 除 ( 取 比 商 小 的 最 大 整数 ) 〈 关 于 “地 板 除 ”请 参考 第 5 章 一 一 译 者 注 ) ， 而 浮 


点 除法 是 真正 的 除法 ， 不 管 操 作 数 是 什么 类 型 ， 浮 点 除法 总 是 执行 真正 的 除法 。 你 可 以 在 第 五 
A T) 学 到 更 多 有 关 传 统 除法 、 真 正 的 除法 及 浮 点 除法 的 知识 。 




















4 











还 有 一 个 乘 方 运 算 符 ， 双星 号 (##) 。 尽 管 我 们 一 直 强 调 这 些 运算 符 的 算术 本 质 ， 但 是 请 
注意 对 于 其 它 数据 类 型 ， 有 些 运 算 符 是 被 重 载 了 ， 比 如 字符 串 和 列表 。。 让 我 们 看 一 个 例子 : 








dim 








> - 
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22^ print -2 * 4 + 3 ** 2 

就 象 你 看 到 的 ， 运算 符 的 优先 级 和 你 想象 的 一 样 : + 和 一 优先 级 最 低 ， *, /, //, % 
优先 级 较 高 ， 单 目 运算 符 + 和 - 优先 级 更 高 ， 乘 方 的 优先 级 最 高 。(3 ** 2) 首先 求 值 ， 然 
后 是 〈-2 * 4), 然后 是 对 两 个 结果 进行 求 和 。 











Python 当然 也 有 标准 比较 运算 符 ， 比较 运算 根据 表达 式 的 值 的 真 假 返回 布尔 值 : 
< <= > >= == I= © 


试 一 试 ， 看 看 这 些 比较 运算 会 得 到 什么 结果 : 
D> 264 
True 
2> 2 == 4 
False 
D> 2>4 
False 
D> 6.2 <= 6 
False 
D> 6.2 <= 6.2 
True 
222 6.2 <= 6. 20001 
True 


Python 目前 支持 两 种 “不 等 于 ”比较 运算 符 ， !- 和 《> , 分 别 是 C 风格 和 ABC/Pascal 
风格 。 目 前 后 者 慢 慢 地 被 淘汰 了 ， 所 以 我 们 推荐 使 用 前 者 。 

Python 也 提供 了 逻辑 运算 符 : 

and or not 




















使 用 逻辑 运算 符 可 以 将 任意 表达 式 连接 在 一 起 ， 并 得 到 一 个 布尔 值 : 





D> 26 4 and 2 = 4 
False 

D> 2>4o0r2¢64 
True 

222 not 6.2 = 6 
True 

D> 38 SASS 

True 
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最 后 一 个 例子 在 其 他 语言 中 通常 是 不 合法 的 ， 不 过 Python 文 持 这 样 的 表达 式 ， 既 简洁 又 
优美 。 它 实际 上 是 下 面 表 达 式 的 缩写 : 





D> 8 6 4and4 65 


参阅 章节 4. 5 种 可 以 得 到 更 多 有 关 Python 运算 符 的 信息 。 


核心 风格 : ”合理 使 用 括号 增强 代码 的 可 读 性 , 在 很 多 场合 使 用 括号 都 是 一 个 好 主意 ， 而 没 
用 括号 的 话 , 会 使 程序 得 到 错误 结果 , 或 使 代码 可 读 性 降低 ,引起 阅读 者 困惑 。。 括号 在 Python 
语言 中 不 是 必须 存在 的 ， 不 过 为 了 可 读 性 ， 使 用 括号 总 是 值得 的 。 任 何 维护 你 代码 的 人 会 感 
谢 你 ， 在 你 再 次 阅读 自己 的 代码 时 ， 你 也 会 感谢 你 自己 。 


2.5 变量 和 赋值 


Python 中 变量 名 规则 与 其 它 大 多 数 高 级 语言 一 样 ， 都 是 受 C 语言 影响 (或 者 说 这 门 语言 
本 身 就 是 5 语言 写成 的 ) 。 变 量 名 仅仅 是 一 些 字母 开头 的 标识 符 一 一 所 谓 字母 开头 一 一 意 指 大 
写 或 小 写字 母 ， 另 外 还 包括 下 划 线 (4 ). 其 它 的 字符 可 以 是 数字 ， 字 母 ， 或 下 划 线 。Python 
变量 名 是 大 小 写 敏感 的 ， 也 就 是 说 变量 “cAsE” 与 “CaSe” 是 两 个 不 同 的 变量 。 


















































Python 是 动态 类 型 语言 ， 也 就 是 说 不 需要 预先 声明 变量 的 类 型 。 变量 的 类 型 和 值 在 赋值 
那 一 刻 被 初始 化 。 变 量 赋值 通过 等 号 来 执行 。 








>> counter = 0 

>>> miles = 1000. 0 

2» name = ’ Bob’ 

222 counter = counter + 1 

222^ kilometers = 1.609 * miles 

2» print ’%f miles is the same as %f km’ % (miles, kilometers) 
1000. 000000 miles is the same as 1609. 000000 km 


上 面 是 五 个 变量 赋值 的 例子 。 第 一 个 是 整数 赋值 ， 第 二 个 是 浮 点 数 赋值 ， 第 三 个 是 字符 串 
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赋值 ， 第 四 个 是 对 一 个 整数 增 1， 最 后 一 个 是 浮 点 乘法 赋值 。 














Python 也 支持 增 量 赋值 ， 也 就 是 运算 符 和 等 号 合并 在 一 起 ， 看 下 面 的 例子 : 


n=n * 10 





将 上 面 的 例子 改 成 增 量 赋值 方式 就 是 : 


n *= 10 





Python 不 支持 C 语言 中 的 自 增 1 和 自 减 1 运算 符 ， 这 是 因为 + 和 一 也 是 单 目 运算 符 ， 
Python 会 将 --n 解释 为 -(-n) 从 而 得 到 n ， 同 样 ++n 的 结果 也 是 n. 


2.6 数字 
Python 支持 五 种 基本 数字 类 型 ， 其 中 有 三 种 是 整数 类 型 。 


e int (有 符号 整数 ) 
e long (长 整数 ) 

@ bool (布尔 值 ) 

e float QZ AIE) 

€ conplex (复数 ) 

下 面 是 一 些 例子 : 


int 0101 84 -237 OxSO 017 -680 -0X92 

long 29979062458L -841401 OxDECADEDEADBEEFBADFEEDDEAL 
bool True False 

float 3.14159 4.2E-10 -90. 6.022e23 —1.609E-19 
complex 6.2341.5j —1.23-875] O+1j —9.80665-8.31441] —.022440j 








Python 中 有 两 种 有 趣 的 类 型 是 Python 的 长 整 型 和 复数 类 型 。 请 不 要 将 Python 的 长 整数 
与 C 语言 的 长 整数 混淆 。Python 的 长 整数 所 能 表达 的 范围 远 远 超过 C 语言 的 长 整数 ， 事实 上 ， 
Python 长 整数 仅 受 限于 用 户 计 算 机 的 虚拟 内 存 总 数 。 如 果 你 熟悉 Java, Python 的 长 整数 类 似 
于 Java 中 的 BigInteger 类 型 。 
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从 长 远 来 看 ， 整 型 与 长 整 型 正在 逐步 统一 为 一 种 整数 类 型 。 从 Python2. 3 开始 ， 再 也 不 会 
报 整 型 溢出 错误 ， 结果 会 自动 的 被 转换 为 长 整数 。 在 未 来 版 本 的 Python rh, 两 种 整数 类 型 将 
会 无 颖 结合 ， 长 整数 后 级 “L” 也 会 变 得 可 有 可 无 。 








布尔 值 是 特殊 的 整数 。 尽管 布尔 值 由 常量 True 和 False 来 表示 ， 如 果 将 布尔 值 放 到 一 
个 数值 上 下 文 环境 中 《比方 将 True 与 一 个 数字 相 加 ) ， True 会 被 当成 整数 值 1, 而 False 
则 会 被 当成 整数 值 0。 复数 〈 包 括 -1 的 平方 根 ， 即 所 谓 的 虚数 ) 在 其 它 语言 中 通常 不 被 直接 
支持 《一般 通过 类 来 实现 ) 。 














其 实 还 有 第 六 种 数字 类 型 ， decimal， 用 于 十 进 制 浮 点 数 。 不 过 它 并 不 是 内 建 类 型 ， 你 
必须 先导 入 decimal 模块 才 可 以 使 用 这 种 数值 类 型 。 由 于 需求 日 渐 强烈 ， Python 2.4 增加 
了 这 种 类 型 。 举 例 来 说 ， 由 于 在 二 进 制 表示 中 有 一 个 无 限 循环 片段 ， 数 字 1. 1 无 法 用 二 进 制 浮 
点 数 精确 表示 。 因 此 ， 数字 1. 1 实际 上 会 被 表示 成 : 






































D> 11 
1. 1000000000000001 


2» print decimal. Decimal ( 1. 1’) 
1.1 


第 五 章 详细 将 介绍 所 有 的 数字 类 型 
2.7 字符 串 


Python 中 字符 串 被 定义 为 引号 之 间 的 字符 集合 。Python 支持 使 用 成 对 的 单 引 号 或 双 引 号 ， 
三 引号 〈 三 个 连续 的 单 引 号 或 者 双 引 号 ) 可 以 用 来 包含 特殊 字符 。 使 用 索引 运算 符 ([ ] ) 和 切 
片 运算 符 ([ : ] ) 可 以 得 到 子 字符 串 。 字 符 串 有 其 特有 的 索引 规则 : 第 一 个 字符 的 索引 是 0, 
最 后 一 个 字符 的 索引 是 一 1 



































加 号 (+ ) 用 于 字符 串 连 接 运 算 ， 星 号 ( * ) 则 用 于 字符 串 重 复 。 下 面 是 几 个 例子 : 





2» pystr = 'Python' 
22^ iscool = 'is cool!’ 
22» pystrí0] 

P 
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29 iscool[:2] 
bog 

22» iscool[3:] 
"cool!' 

222 iscool[-1] 


a ud 


222 pystr + iscool 
’Pythonis cool!’ 
poo pystr +? * 
’Python is cool!’ 
222 pystr * 2 
'PythonPython' 
2205 '—' * 20 


* iscool 


# 





2» pystr = ’’’ python 
. is cool’’’ 
222 pystr 
*python\nis cool’ 

222 print pystr 

python 

is cool 

P», 


你 可 以 在 第 六 章 学 到 更 多 有 关 字符 串 的 知识 。 
2.8 列表 和 元 组 


可 以 将 列表 和 元 组 当成 普通 的 “数组 ”, 它 能 保存 任意 数量 任意 类 型 的 Python 对 象 。 和 数 
组 一 样 ， 通 过 从 0 开始 的 数字 索引 访问 元 素 ， 但 是 列表 和 元 组 可 以 存储 不 同类 型 的 对 象 。 








列表 和 元 组 有 几 处 重要 的 区 别 。 列 表 元 素 用 中 括号 [ DE. TOR US OR BA FERT 
以 改变 。 元 组 元 素 用 小 括号 (()) 包 圳 ， 不 可 以 更 改 〈 尽 管 他 们 的 内 容 可 以 ) 。 元 组 可 以 看 成 是 
只 读 的 列表 。 通 过 切片 运算 (上 ] 和 [ : ] ) 可 以 得 到 子 集 ， 这 一 点 与 字符 串 的 使 用 方法 一 样 。 
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2 abist = /1, S 3, 4 
222 alist 

[L 2 3 4 

2» aListí0] 


2 aList/2:] 

/3 4] 

2 aLlist[:3] 

[L 2 3J 

M aList/[1] = 5 

222 alist 

[L 5 3% 4 

元 组 也 可 以 进行 切片 运算 ， 得 到 的 结果 也 是 元 组 〈 不 能 被 修改 ) : 








2» afuple = (robots’, 77, 93, "try ^) 

>>> afuple 

(robots, 77, 93, "£ry Jj 

225 afuplel:3/ 

(robots’, 77, 93) 
2> alfuplelll = 5 
Traceback (innermost last): 
File “<stdim”*, line l, in ? 
TypeError: object doesn’t support item assignment 


你 可 以 在 第 六 章 学 到 更 多 有 关 列表 、 元 组 以 及 字符 串 的 知识 。 
2.9 字典 
字典 是 Python 中 的 映射 数据 类 型 ， 工 作 原理 类 似 Perl 中 的 关联 数组 或 者 哈 希 表 ， 由 键 - 


值 (key-value) 对 构成 。 几 乎 所 有 类 型 的 Python 对 象 都 可 以 用 作 键 ， 不 过 一 般 还 是 以 数字 或 者 
字符 串 最 为 常用 。 











值 可 以 是 任意 类 型 的 Python 对 象 ， 字 典 元 素 用 大 括号 ({ DAR. 


© 
e 





二 一 —o— 一 全 


Edit By Vheavens 








Edit By Vheavens 





2» aDict = Chost’: 'earth'] # create dict 
2» aDict[’ port’ ] = 80 # add to dict 
222 aDict 
f'host': 'earth', 'port': 80} 
22» aDict. keys O 
[ host’, 'port'] 
Ao» abietl host ] 
'earth' 
225^ for key in aDict: 
. print key, aDict[key/ 


host earth 
port 80 
在 第 七 章 中 会 详细 讲解 字典 。 


2.10 代码 块 及 缩 进 对 齐 


$ 代码 块 通过 缩 进 对 齐 表达 代码 逻辑 而 不 是 使 用 大 括号 ,因为 没有 了 额外 的 字符 ， 程 序 的 可 è 
d 











性 更 高 。 而 且 缩 进 完全 能 够 清楚 地 表达 一 个 语句 属于 哪个 代码 块 。 当 然 ， 代 码 块 也 可 以 只 有 
一 个 语句 组 成 。 





对 一 个 Python 初学 者 来 说 ， 仅 使 用 缩 进 可 能 令 他 诈 异 。 人 们 通常 竭力 避免 改变 ， 因此 
对 那些 使 用 大 括号 很 多 年 的 人 来 说 ， 初次 使 用 纯 缩 进来 表示 逻辑 也 许 会 多 少 感到 有 些 不 够 坚定 。 
《不 用 大 括号 ?到底 成 不 成 啊 ? ) 。 然 而 回想 一 下 ， python 有 两 大 特性 ， 一 是 简洁 ， 二 是 可 
读 性 好 。 如 果 你 实在 讨厌 使 用 缩 进 作为 代码 分 界 ， 我 们 希望 你 从 现在 开始 ， 半 年 后 再 来 看 一 下 
这 种 方式 。 也 许 你 会 发 现 生活 中 没有 大 括号 并 不 会 象 你 想像 的 那么 糟糕 。 
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标准 if 条 件 语句 的 语法 如 下 : 
If expression: 
If suite 


如 果 表 达 式 的 值 非 0 或 者 为 布尔 值 True， 则 代码 组 if suite 被 执行 ; 否则 就 去 执行 下 一 
条 语句 。 代码 组 是 一 个 Python 术语 ， 它 由 一 条 或 多 条 语句 组 成 ， 表 示 一 个 子 代码 块 。Python 
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与 其 它 语言 不 同 ， 条 件 条 达 式 并 不 需要 用 括号 括 起 来 。 


If x c .07 
print '" x" must be atleast O!’ 





Python 当然 也 支持 else 语句 ， 语法 如 下 : 
if expression: 

if suite 
else: 

else suite 





Python 还 支持 elif (BiB “else-if ” ) 语句 ， 语 法 如 下 : 


if expressionl: 

if suite 
elif expressionZ: 

elif suite 
else: 

else suite 








在 本 书写 作 之 时 ， 正在 进行 一 个 关于 是 否 需要 增加 switch/case 语句 的 讨论 ， 不 过 目前 
并 没有 什么 实质 性 的 进展 。 在 将 来 版 本 的 Python 语言 当中 ， 也 非常 有 可 能 看 到 这 样 的 “ 动 
物 ”。 这 个 例子 似乎 有 点 奇怪 、 让 人 觉得 困惑 ， 但 是 因为 有 了 Python 干净 的 语法 ， 
if-elif-else 语句 并 不 象 别 人 说 的 那么 丑陋 (以 致 不 能 让 人 接受 ) 。 如 果 你 非 要 避免 写 一 堆 
if-elif-else 语句 ， 另 一 种 变通 的 解决 方案 是 使 用 for 循环 (参阅 2.13) RERE HEM 
"cases" 列表 。 

















在 第 8 章 你 可 以 学 到 更 多 有 关 if, elif, else 条 件 语句 的 知识 。 


2.12 while 循环 











标准 while 条 件 循环 语句 的 语法 类 似 让 ， 再 说 一 次 ， 要 使 用 缩 进来 分 隅 每 个 子 代码 块 。 
while expression: 
while suite 


dim 








二 一 —o— 一 全 


Edit By Vheavens 





Edit By Vheavens 


| T 


语句 while suite 会 被 连续 不 断 的 循环 执行 ， 直到 表达 式 的 值 变 成 0 或 False; 接着 
Python 会 执行 下 一 句 代码 。 类 似 if 语句 ， Python 的 while 语句 中 的 条 件 表达 式 也 不 需要 用 
括号 括 起 来 。 











222 counter = 0 
222^ while counter < 3: 
. print 'loop #%d’ % (counter) 
counter += J 
loop #0 
loop #1 
loop #2 
while JAMA EWEA for 循环 会 在 第 8 章 的 循环 一 节 进 行 详细 讲解 。 


2.13 for 循环 和 range () NERA 
Python 中 的 for 循环 与 传统 的 for 循环 〈 计 数 器 循环 ) 不 太一 样 ， 它 更 象 shell 脚本 里 


的 foreach 3&f&. Python 中 的 for ZARI R CHIME IBGE at) 作为 其 参数 ， 每 次 
JETER M PO 





2» print 'I like to use the Internet for:' 
I like to use the Internet for: 
2 for item in [ e-mail’, 'net-surfing', ’ homework’, 
"chat f 
. print item 


e-mail 

net-surfing 

homework 

chat 

上 面 例子 的 输出 如 果 能 在 同一 行 就 会 美观 许多 。print 语句 默认 会 给 每 一 行 添加 一 个 换行 
fF. AZ print 语句 的 最 后 添加 一 个 逗号 (,)， 就 可 以 改变 它 这 种 行为 。 











print 7 like to use the Internet for: 
for item in [ e-mail’, 'net-surfing , ’ homework’, ° chat’ J: 


$ 
e 
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print item, 
print 
上 面 的 代码 还 添加 了 一 个 额外 的 没有 任何 参数 的 print 语句 ， 它 用 来 输出 一 个 换行 符 。 
否则 ， 提示 信息 就 会 立刻 出 现在 我 们 的 输出 之 后 。 下 面 是 以 上 代码 的 输出 
I like to use the Internet for. 
e-mail net-surfing homework chat 
A f 5 MISSA, es) print 语句 输出 的 元 素 之 间 会 自动 添加 一 个 空格 。 通 过 指定 
输出 格式 ， 程序 员 可 以 最 大 程度 的 控制 输出 布局 ， 也 不 用 担心 这 些 自动 添加 的 空格 。 
以 将 所 有 数据 放 到 一 处 输出 一 一 只 需要 将 数据 放 在 格式 化 运算 符 右 侧 的 元 组 或 字典 中 。 











年 | 








22 who = ‘knights’ 


> what = NiC 
2» print 'We are the’, who, 'who say’, what, 
We are the knights who say Ni! Ni! Ni! Ni 
^ Q 


2» print "We are the %s who say %s? % | 
"PE (who, ((what +” ') * 4)) 
We are the knights who say Ni! Ni! Ni! Ni 


what, what, what 


就 象 你 在 刚才 的 例 





一 些 字 符 串 输出 之 前 的 整理 工作 ， 


使 用 字符 串 格式 运算 符 还 允许 我 们 做 

子 中 看 到 的 一 样 。 
通过 演示 一 个 让 Python for 循环 更 象 传统 循环 (换言之 ， 计数 循环 ) 的 示例 ， 我 们 来 
结束 对 循环 的 介绍 。 因 为 我 们 不 能 改变 for 循环 的 行为 《迭代 一 个 序列 ) ， 我 们 可 以 生成 一 
这 样 ， 尽 管 我 们 确实 是 在 迭代 一 个 序列 ， 但 是 它 至 少 展示 的 是 递增 计数 的 效果 。 





























个 数字 序列 。 


2 for eachNum in [0, 1, 2]: 
print eachNum 





在 这 个 循环 中 ， eachNum 包含 的 整数 值 可 以 用 于 显示 ， 也 可 以 用 于 计算 。 因 为 我 们 要 使 


| | $ —o— 
Edit By Vheavens 


e+ 











Edit By Vheavens 


e+ 















-e| 


用 的 数值 范围 可 能 会 经 常 变化 ，Python 提供 了 一 个 range O 内 建 函 数 来 生成 这 种 列表 。 它 正好 
能 满足 我 们 的 需要 ， 接受 一 个 数值 范围 ， 生成 一 个 列表 。 








2» for eachNum in range(3): 
print eachNum 


0 
7 
2 


对 字符 串 来 说 ， RAE IEE FFF 








22 foo = abec’ 
222 for c in foo: 
print c 


a 
b 


C 











range Q 函数 经 党 和 len O 函数 一 起 用 于 字符 串 索 引 。 在 这 里 我 们 要 显示 每 一 个 元 素 及 其 





索引 值 : 
2» foo = abc’ 
2» for i in range(len(foo)): 
. print fooli], '(Wd)' % i 


a (0) 
b (I) 
c (2) 





不 过 ， 这 些 循环 有 一 个 约束 ， 你 要 么 循环 索引 ， 














要 么 循环 元 素 。 这 导致 了 enumerate () 


函数 的 推出 (Python2. 3 新 增 ) 。 它 同 时 做 到 了 这 两 点 : 


2 for i, ch in enumerate (foo): 
. print ch, '(Ud)' % i 


n (0) 
b (I) 
c (2 
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这 是 一 个 让 人 欣喜 的 术语 ， 表 示 你 可 以 在 一 行 中 使 用 一 个 for 循环 将 所 有 值 放 到 一 个 列表 
当中 : 

2» squared = [x ** 2 for x in range (4) ] 

222 for i in squared: 
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. print i 


SOS: 





列表 解析 甚至 能 做 更 复杂 的 事情 ， 比如 挑选 出 符合 要 求 的 值 放 入 列表 : 





2» sqdEvens = [x ** 2 for x in range(8) if not x % 2] 
222 


225^ for i in sqdEvens: 


... print i 
0 

4 

16 


36 


2.15 文件 和 内 建 函 数 open 0) ~ fileO 
在 你 已 经 习惯 一 门 语言 的 语法 之 后 ， 文件 访问 是 相当 重要 的 一 环 。 在 一 些 工 作 做 完 之 后 ， 
将 它 保 存 到 持久 存储 是 很 重要 的 。 








如 何 打开 文件 

handle = open(file name, access mode = 'r') 

file name 变量 包含 我 们 希望 打开 的 文件 的 字符 串 名 字 ， access_mode 中 “r” 表 示 读 取 ， 
'"w 表示 写 入 ，“a 表示 添加 。 其 它 可 能 用 到 的 标 声 还 有 “+ ”表示 读 写 ，“b 表示 二 进 制 访 
|]. 如果 未 提供 access mode ， 默认 值 为 “7 o WR opn) 成 功 ， 一 个 文件 对 象 句 柄 会 被 
返回 。 所 有 后 续 的 文件 操作 都 必须 通过 此 文件 句柄 进行 。 当 一 个 文件 对 象 返 回 之 后 ， 我 们 就 可 
以 访问 它 的 一 些 方法 ， 比如 readlinesO 和 close 0 .文件 对 象 的 方法 属性 也 必须 通过 句点 属 
性 标识 法 访问 (参阅 下 面 的 核心 笔记 ) 



































dim 
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核心 笔记 : 什么 是 属性 ? 

属性 是 与 数据 有 关 的 项 目 ， 属性 可 以 是 简单 的 数据 值 ， 也 可 以 是 可 执行 对 象 ， 比如 函数 
和 方法 。 哪 些 对 象 拥有 属性 呢 ? 很 多 。 类 ， 模块 ， 文件 还 有 复数 等 等 对 象 都 拥有 属性 。 

我 如 何 访问 对 象 属性 ? 使 用 句点 属性 标识 法 。 也 就 是 说 在 对 象 名 和 属性 名 之 间 加 一 个 句 
Hi: object. attribute 








下 面 有 一 些 代 码 ， 提 示 用 户 输入 文件 名 ， 然 后 打开 一 个 文件 ， 并 显示 它 的 内 容 到 屏幕 上 : 
filename = raw input( Enter file name: ') 
fobj = open (filename, 'r') 
for eachLine in fobj: 
print eachLine, 
fob j. close Q 
我 们 的 代码 没有 用 循环 一 次 取 一 行 显示 ， 而 是 做 了 点 改变 。 我 们 一 次 读 入 文件 的 所 有 行 ， 
然后 关闭 文件 ， 再 友 代 每 一 行 输出 。 这 样 写 代码 的 好 处 是 能 够 快速 完整 的 访问 文件 。 内 容 输出 
和 文件 访问 不 必 交 蔡 进 行 。 这 样 代码 更 清晰 ， 而 且 将 不 相关 的 任务 区 分 开 来 。 需 要 注意 的 一 点 
是 文件 的 大 小 。 上 面 的 代码 适用 于 文件 大 小 适中 的 文件 。 对 于 很 大 的 文件 来 说 ， 上 面 的 代码 
会 占用 太 多 的 内 存 ， 这 时 你 最 好 一 次 读 一 行 。《〈 下 一 节 有 一 个 好 例子 ) 
我 们 的 代码 中 另 一 个 有 趣 的 语句 是 我 们 又 一 次 在 print 语句 中 使 用 去 号 来 抑制 自动 生成 
的 换行 符号 。 为 什么 要 这 样 做 ? 因为 文件 中 的 每 行文 本 已 经 自 带 了 换行 字符 ， 如 果 我 们 不 抑 
制 print 语句 产生 的 换行 符号 ， 文本 在 显示 时 就 会 有 额外 的 空 行 产 生 。 
file() 内 建 函数 是 最 近 才 添加 到 Python 当中 的 。 它 的 功能 等 同 于 openO, 不 过 file 0 
这 个 名 字 可 以 更 确切 的 表明 它 是 一 个 工厂 函数 。“《〈 生 成 文件 对 象 ) 类 似 int O 生成 整数 对 象 ， 
dict 0 生成 字典 对 象 。 在 第 9 章 ， 我 们 详细 介绍 文件 对 象 ， 及 它们 的 内 建 方法 属性 ， 以 及 如 
何 访问 本 地 文件 系统 。 请 参考 第 9 章 以 了 解 详 细 信 息 。 


2. 16 错误 和 异常 
编译 时 会 检查 语法 错误 ， 不 过 Python 也 人 允许 在 程序 运行 时 检测 错误 。 当 检测 到 一 个 错误 ， 


Python 解释 器 就 引发 一 个 异常 ， 并 显示 异常 的 详细 信息 。 程 序 员 可 以 根据 这 些 信息 迅速 定位 
问题 并 进行 调试 ， 并 找 出 处 理 错误 的 办 法 。 











































































































要 给 你 的 代码 添加 错误 检测 及 异常 处 理 ， 只 要 将 它们 封装 在 try-except 语句 当中 。 try 
之 后 的 代码 组 ， 就 是 你 打算 管理 的 代码 。 except 之 后 的 代码 组 ， 则 是 你 处 理 错误 的 代码 。 
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try. 
filename = raw input( Enter file name: ') 
fobj = open (filename, 'r') 

for eachLine in fobj: 

print eachLine, fobj.close() 

except lÜError, e: 

print 'file open error:’, e 





程序 员 也 可 以 通过 使 用 raise 语句 故意 引发 一 个 异常 。 在 第 10 章 你 可 以 学 到 更 多 有 关 


Python 异常 的 知识 。 


27 函数 


类 似 其 它 的 语言 ， Python 中 的 函数 使 用 小 括号 ( 0 ) 调用。 函数 在 调用 之 前 必须 先 定义 。 


如 果 函 数 中 没有 return 语句 ， 就 会 自动 返回 None WR. 
Python 是 通过 引用 调用 的 。 这 意味 着 函数 内 对 参数 的 改变 会 影响 到 原始 对 象 。 不 过 事实 


上 只 有 可 变 对 象 会 受 此 影响 ， 对 不 可 变 对 象 来 说 ， 它 的 行为 类 似 按 值 调用 。 

















如 何 定 义 函 数 


def function name([arguments]): 
“optional documentation string” 


function suite 














定义 一 个 函数 的 语法 由 def 关键 字 及 紧 随 其 后 的 函数 名 再 加 上 该 函数 需要 的 几 个 参数 组 
成 。 函 数 参数 (比较 上 面 例子 中 的 arguments) 是 可 选 的 ， 这 也 是 为 什么 把 它们 放 到 中 括号 中 
的 原因 。 在 你 的 代码 里 千 万 别 写 上 中 括号 ! 〉 这 个 语句 由 一 个 冒号 (:) 结 束 (与 if 和 while 
语句 的 结束 方式 一 样 ) ， 之 后 是 代表 函数 体 的 代码 组 ， 下 面 是 一 个 简短 的 例子 : 

















def addlleZMe (x): 
'apply + operation to argument’ 


return (x * x) 


这 个 函数 ， 干 的 是 “在 我 的 值 上 加 我 ”的 活 。 它 接受 一 个 对 象 ， 将 它 的 值 加 到 自身 ， 然 
后 返回 和 。 对 于 数值 类 型 参数 ， 它 的 结果 是 显而易见 的 ， 不 过 我 要 在 这 里 指出 ， 加 号 运算 符 
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dim 














一 | 


12 
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几乎 与 所 有 数据 类 型 工作 。 换 名 话说 ， 几乎 所 有 的 标准 数据 类 型 都 支持 + 运算 符 ， 不 管 是 数 





值 相 加 还 是 序列 合并 。 


如 何 调用 函数 


>> addMe2Me (4. 25) 

8.5 

222 

22^ addile2Me (10) 

20 

222 

22» addMeZMe C Python’) 
"PythonPython' 

2252 

22» addMeZMe ([-1, 'abc']) 
[-L 'abc', -L 'abc'] 





Python 语言 中 调用 函数 与 在 其 它 高 级 语言 中 一 样 ， 函数 名 加 上 函数 运算 符 ， 一 对 小 括 
号 。 括 号 之 间 是 所 有 可 选 的 参数 。 即 使 一 个 参数 也 没有 ， 小 括号 也 不 能 省 略 。 注 意 一 下 ，+ 运 





算 符 在 非 数 值 类 型 中 如 何 工作 。 























函数 的 参数 可 以 有 一 个 默认 值 ， 如 果 提 供 有 默认 值 ， 在 函数 定义 中 ， 参数 以 赋值 语句 的 
形式 提供 。 事 实 上 这 仅仅 是 提供 默认 参数 的 语法 , 它 表示 函数 调用 时 如 果 没 有 提供 这 个 参数 ， 它 

















就 取 这 个 值 做 为 默认 值 。 
22» def foo (debug=True) : 

















*determine if in debug mode with default argument’ 


. If debug: 
. print 'in debug mode’ 
. print ’ done’ 


2» fool) 

in debug mode 
done 

2» foo (False) 
done 











> -$ 
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dim 
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在 上 面 的 例子 里 ， debug 参数 有 一 个 默认 值 True. 如 果 我 们 没有 传递 参数 给 函数 fool), 
debug 自动 拿 到 一 个 值 ， True. 在 第 二 次 调用 fooO 时 ， 我 们 故意 传递 一 个 参数 False 给 
foo), 这 样 ， 默认 参数 就 没有 被 使 用 。 函数 拥有 的 特性 远 比 我 们 在 这 里 介绍 的 多 ， 请 阅读 
第 11 章 以 了 解 更 详细 的 函数 的 信息 。 


2. 18 类 
类 是 面向 对 象 编程 的 核心 ， 它 扮演 相关 数据 及 逻辑 的 容器 角色 。 它 们 提供 了 创建 “真实 ” 


对 象 ( 也 就 是 实例 ) 的 蓝图 。 因为 Python 并 不 强求 你 以 面向 对 象 的 方式 编程 (与 Java 不 同 )， 此 
刻 你 也 可 以 不 学 习 类 。 不 过 我 们 还 是 在 这 儿 放 了 些 例子 ， 以 方便 感 兴趣 的 读者 浏览 。 






































如 何 定义 类 


class ClassName (base class[es]): 
“optional documentation string” 
static_member_declarations 
method declarations 


使 用 class 关键 字 定 义 类 。 可 以 提供 一 个 可 选 的 父 类 或 者 说 基 类 ;如果 没有 合适 的 基 类 ， 
那 就 使 用 object 作为 基 类 。class 行 之 后 是 可 选 的 文档 字符 串 ， 静态 成 员 定 义 ， 及 方法 定 
义 。 

class FooClass (object): 
“my very first class: FooClass 
version = 01 # class (data) attribute 
def | init (self, nm-'John Doe’): 
“> anstructor ^ 
self. name = nm # class instance (data) attribute 
print 'Created a class instance for’, nm 
def showname (self): 
^^"display instance attribute and class name 
print 'Your name is’, self. name 
print 'My name is’, self. class . name 
def showver (self): 
^^^ display class (static) attribute 
print self. version # references FooClass. version 


def addMe2Me (self, x): # does not use ‘self’ 


UUW 












































unn 


UUM 





VU 


"nn 


apply + operation to argument 
return x * x 
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在 上 面 这 个 类 中 ， 我 们 定义 了 一 个 静态 变量 version， 它 将 被 所 有 实例 及 四 个 方法 共享 ， 
. init _ (0， showname ()，showver 0， 及 熟悉 的 addMe2Me O. 这些 show*( 方 法 并 没有 做 什 
么 有 用 的 事情 ， 仅仅 输出 对 应 的 信息 。 ”init O 方法 有 一 个 特殊 名 字 ， 所 有 名 字 开 始 和 
结束 都 有 两 个 下 划 线 的 方法 都 是 特殊 方法 。 
当 一 个 类 实例 被 创建 时 ， ^ init O0 方法 会 自动 执行 ， 在 类 实例 创建 完毕 后 执行 ， 类 
Wea eK. — init  O 可 以 被 当成 构建 函数 ， 不 过 不 象 其 它 语言 中 的 构建 函数 ， 它 并 不 创 
建 实例 一 它 仅 仅 是 你 的 对 象 创建 后 执行 的 第 一 个 方法 。 它 的 目的 是 执行 一 些 该 对 象 的 必要 的 初 
始 化 工作 。 通 过 创建 自己 的 init 0 方法， 你 可 以 履 盖 默认 的 init 0 方法 (默认 的 
方法 什么 也 不 做 ), 从 而 能 够 修饰 刚刚 创建 的 对 象 .在 这 个 例子 里 ， 我 们 初始 化 了 一 个 名 为 name 
的 类 实例 属性 (或 者 说 成 员 ) 。 这 个 变量 仅 在 类 实例 中 存在 ， 它 并 不 是 实际 类 本 身 的 一 部 分 。 
init 0 需要 一 个 默认 的 参数 ， 前 一 节 中 曾经 介绍 过 。 毫 无 疑问 ， 你 也 注意 到 每 个 方法 都 有 
的 一 个 参数 ， self. 

什么 是 self ? 它 是 类 实例 自身 的 引用 。 其 他 语言 通常 使 用 一 个 名 为 this 的 标识 符 。 


如 何 创建 类 实例 
2» fool = FooClass () E: 


Created a class instance for John Doe 














































































































屏幕 上 显示 的 字符 串 正 是 自动 调用 init 0 方法 的 结果 。 当 一 个 实例 被 创建 ， 
init Oo 就 会 被 自动 调用 。 不 管 这 个 _int 0 是 自 定义 的 还 是 默认 的 。 





























创建 一 个 类 实例 就 像 调 用 一 个 函数 ， 它们 确实 拥有 一 样 的 语法 。 它 们 都 是 可 调用 对 象 。 类 
实例 使 用 同样 的 函数 运算 符 调用 一 个 函数 或 方法 。 既然 我 们 成 功 创建 了 第 一 个 类 实例 ， 那 现 在 
来 进行 一 些 方 法 调用 : 














222 fool. showname() Your name is John Doe 
My name is | main .FooClass 

222 

22» fool. showver () 

0.1 

2» print fool. addMeZlfe (5) 

10 

2» print fool. addMeZMe ( xyz’) 





dim 
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XVZXyZ 


每 个 方法 的 调用 都 返回 我 们 期 望 的 结果 。 比 较 有 趣 的 数据 是 类 名 字 。 在 showname () 方 法 中 ， 














我 们 显示 self. class . name ”变量 的 值 。 对 一 个 实例 来 说 ， 这 个 变量 表示 实例 化 它 的 
类 的 名 字 。 Cself. _class 引用 实际 的 类 )〉 。 在 我 们 的 例子 里 ， 创建 类 实例 时 我 们 并 未 传递 
名 字 参 数 ， 因此 默认 参数 “John Doe ”就 被 自动 使 用 。 在 我 们 下 一 个 例子 里 ， 我 们 将 指定 一 














个 参数 。 
22» foo2 = FooClass( Jane Smith’) Created a class instance for Jane Smith 
22» fooZ. showname () 
Your name is Jane Smith 
My name is FooClass 


第 十 三 章 将 详细 介绍 Python 类 和 类 实例 。 


2. 19 模块 


模块 是 一 种 组 织 形式 ， 它 将 彼此 有 关系 的 Python 代码 组 织 到 一 个 个 独立 文件 当中 。 
模块 可 以 包含 可 执行 代码 ， 函数 和 类 或 者 这 些 东西 的 组 合 。 

















当 你 创建 了 一 个 Python 源 文件 , 模块 的 名 字 就 是 不 带 .py 后 缀 的 文件 名 。 一 个 模块 创 


建 之 后 ， 你 可 以 从 男 一 个 模块 中 使 用 import 语句 导入 这 个 模块 来 使 用 。 





如 何 导 入 模块 
import module name 


如 何 访问 一 个 模块 函数 或 访问 一 个 模块 变量 





一 旦 导入 完成 ， 一 个 模块 的 属性 (函数 和 变量 ) 可 以 通过 熟悉 的 .句点 属性 标识 法 访问 。 








module. function () 
module. variable 











现在 我 们 再 次 提供 Hello World! 例子 ， 不 过 这 次 使 用 sys 模块 中 的 输出 函数 。 





222 import sys 


E 
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222 sys. stdout. write( Hello World!\n’) 

Hello World! 

222 sys. platform 

"win32' 

222 sys. version 

'24.2 (#67, Sep 28 2005, 10:51:12) [MSC v. 1310 32 bit 
(Inte1) ]' 


这 些 代码 的 输出 与 我 们 使 用 print 语句 完全 相同 。 唯一 的 区 别 在 于 这 次 调用 了 标准 给 出 
的 write (方法 , 而 且 这 次 需要 显 式 的 在 字符 串 中 提供 换行 字符 ， 不 同 于 print H, write) 
不 会 自动 在 字符 串 后 面 添加 换行 符号 。 


























关于 模块 和 导入 ， 你 可 以 在 第 12 章 中 得 到 更 多 有 用 的 信息 。 在 那里 会 详细 介绍 本 章 上 面 
所 有 提 到 的 主题 ， 和 希望 我 们 提供 的 快速 入 门 能 达到 你 迅速 使 用 Python 开始 工作 的 目标 。 


























核心 笔记 : 什么 是 “PEP”? 

在 本 书 中 你 会 经 常 看 到 PEP 这 个 字眼 。 一 个 PEP 就 是 一 个 Python 增强 提案 (Python 
Enhancement Proposal), 这 也 是 在 新 版 Python 中 增加 新 特性 的 方式 。 从 初学 者 的 角度 看 ， 
它们 是 一 些 高 级 读物 ， 它 们 不 但 提供 了 新 特性 的 完整 描述 ， 还 有 添加 这 些 新 特性 的 理由 ， 如 
果 需 要 的 话 ， 还 会 提供 新 的 语法 、 技术 实现 细节 、 向 后 兼容 信息 等 等 。 在 一 个 新 特性 被 整合 

进 Python 之 前 ， 必 须 通 过 Python 开发 社区 ，PEP 作 者 及 实现 者 ， 还 有 Python 的 创始 人 ，Guido 
van Rossum (Python 终身 的 仁慈 的 独裁 者 ) 的 一 致 同意 。PEP1 阐述 了 PEP 的 目标 及 书写 指南 。 
在 PEPO 中 可 以 找到 所 有 的 PEP。 PEP 索引 的 网 址 是 : http://python. org/dev/peps. 


2. 19 实用 的 函数 
ABH, 我 们 用 到 了 很 多 实用 的 内 建 函 数 。 我 们 在 表 2. 1 中 总 结 了 这 些 函 数 ， 并 且 提 供 


了 一 些 其 它 的 有 用 函数 。 “注意 我 们 并 没有 提供 完整 的 使 用 语法 ， 仅 提供 了 我 们 认为 可 能 对 你 
有 用 的 部 分 ) 



























































K 2.1 对 新 Python FEF nA FA AY A ER 





函数 描述 
dir([obj]) 显示 对 象 的 属性 ， 如 果 没 有 提供 参数 ， 则 显示 全 局 变量 的 名 字 
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KB. 如 果 没 有 提供 任何 参 





~ 


以 一 种 整齐 美观 的 形式 显示 对 象 的 文档 字 


help(Lobj]) 
数 ， 则 会 进入 交互 式 帮助 。 
int (obj) 将 一 个 对 象 转换 为 整数 
len (obj) 返回 对 象 的 长 度 
"WwW = 写 ) 方 式 打 开 一 个 文件 名 为 fn 的 文件 





open(fn, mode) 以 mode? r = ix, 
range([[start,]stopl,step]) 返回 一 个 整数 列表 。 起 始 值 为 start， 结 束 值 为 stop - 1; start 


默认 值 为 0， step 默 认 值 为 1。 
等 待 用 户 输 入 一 个 字符 串 ， 可 以 提供 一 个 可 选 的 参数 str 用 作 提 示 信 











T 


raw input (str) 


息 。 
str (obj) 将 一 个 对 象 转换 为 字符 串 
type (obj) 返回 对 象 的 类 型 (返回 值 本 身 是 一 个 type WHR! ) 


2. 21 练习 
print 和 字符 串 格式 化 运算 符 。 启 动 交互 式 解释 器 。 给 一 些 变量 赋值 ( 字 
有 E: 





























2-1. 2m, 
符 串 ， 数 值 等 等 ) 并 通过 输入 变量 名 显示 它们 的 值 。 再 用 print Tao IEA. KO 
AULA, 慢 慢 熟悉 它 。 
































吏 用 字符 串 格 式 运算 符 96, 





































































































何 区 别 ? 也 尝试 着 使 
2-2. 了 程序 输出 ， 陪读 下 面 的 Python 脚本 : 
#Vusr/bin/env python 
1*2*4 
(a) “你 认为 这 段 脚 本 是 用 来 做 什么 的 ? 
b 你 认为 这 段 脚 本 会 输出 什么 ? 
(c) 输入 以 上 代码 ， 并 保存 为 脚本 ， 人 然后 运行 它 。 它 所 做 的 与 你 的 预期 一 样 吗 ? 为 什么 一 
样 /不 一 样 ? 
(d)” 这 上 段 代码 单独 执行 和 在 交互 解释 器 中 执行 有 何不 同 ? 试 一 下 ， 然 后 写 出 结果 
E 它 能 和 你 想像 的 一 样 工 作 ? 





gu 


(e) 如 何 改进 这 个 脚本 ， 以 便 
2-3. ”数值 和 运算 符 
8， 使 用 Python 对 两 个 数值 (任意 类 型 ) 进 行 加 、 减 、 乘 、 除 运算 。 然 后 使 


局 动 交 互 解释 器 
用 取 余 运 算 符 来 得 到 两 个 数 相 除 的 余数 ， 最 后 使 用 乘 方 运算 符 求 A 数 的 B 砍 方 。 


使 用 raw_inputO 画 数 得 到 用 户 输入 
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(a) 创建 一 段 脚本 使 用 raw. inputO. KERSAA —A4 EB, MG ARS 


用 户 刚 刚 键入 的 字符 串 。 





(b) 添加 一 段 类 似 的 代码 ， 不 过 这 次 输入 的 是 数值 。 将 输入 数据 转换 为 一 个 数值 对 象 ， (使 






































用 int0 或 其 它 数 值 转 换 函 数 ) 并 将 这 个 值 显示 给 用 户 看 。 (注意 ， 如 果 你 用 的 是 早 于 1.5 的 版 
本 ， 你 需要 使 用 string.atosO. 函数 执行 这 种 转换 ) 

















2-5. ”人 循环 和 数字 
































分 别 使 用 while 和 for 创建 一 个 循环 : 
(a) 写 一 个 while 循环 ， 输 出 整数 从 0 到 10。 (要 确保 是 从 0 到 10， 而 不 是 从 0 到 9 或 


从 1 到 10) 


























(b) 做 同 (a) 一 样 的 事 ， 不 过 这 次 使 用 range() 内 建 酚 数 。 


2-6. 和 条件 判断 








和 判断 一 个 数 是 正 数 ， 还 是 负数 ， 或 者 等 于 0. 开始 先 用 固定 的 数值 ， 然 


















































2-1. 





循环 和 字 串 从 用 户 下 














环 实现 ， 然 后 再 用 for 
2-8. 循环 和 运算 


























后 修改 你 的 代码 支持 用 户 输入 数值 再 进行 判断 











ET 











a 


里 接受 一 个 字符 串 输 入 ， 然 后 逐 字 符 显 示 该 字符 串 。 先 用 while fü 
循环 实现 。 
符 创建 一 个 包含 五 个 固定 数值 的 列表 或 元 组 ， 输 出 他 们 的 和 。 然 后 修 












































改 你 的 代码 为 接受 用 户 
2 








输入 数值 。 分 别 使 用 while 和 for 循环 实现 。 














循环 和 运算 符 创建 





个 包含 五 个 固定 数值 的 列表 或 元 组 ， 和 输出 他 们 的 平均 值 。 本 练习 的 难 









































点 之 一 是 通过 除法 得 到 平均 值 。 你 会 发 现 整 数 除 会 截 去 小 数 ， 因 此 你 必须 使 用 浮 点 除 以 得 到 更 
精确 的 结果 。 floatO 内 建 画 数 可 以 帮助 你 实现 这 一 功能 




















2-10. 























RREPA FA. EH rawinputO Ren JH PHA — ^ 1 41 100 A 
数 ， 如 果 用 户 输入 的 数 满足 这 个 条 件 ， 显 示 成 功 并 退出 。 否 则 显示 一 个 错误 信息 然后 再 次 提示 














用 户 输 入 数值 ， 直 到 满足 条 件 为 止 。 








2-11. 
ARRI RE He 






























































B— Sif CASA RE, STM (I) 取 五 个 数 的 和 (2). 取 五 个 











数 的 平均 值 .… OO) 退出 。 由 用 户 做 一 个 选择 ， 然 后 执行 相应 的 功能 。 当 用 户 选 择 混 出 时 程序 












































对 开发 人 员 测 试 自己 的 程 











结束 。 这 个 程序 的 有 用 之 处 在 于 用 户 在 功能 之 间 切 换 不 需要 一 所 一 T (这 


序 也 会 大 有 用 处 ) 




















2-12. dirON E ER 
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> - 
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dim 
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(a) 局 动 Python 交互 式 解释 器 ， 通过 直接 键入 dirO 回 车 以 执行 dirOP EE EX, (RAFI 
什么 ? 显示 你 看 到 的 每 一 个 列表 元 素 的 值 ， 记 下 实际 值 和 你 想像 的 值 

(b) 你 会 问 , dir0 画 数 是 干什么 的 ? 我 们 已 经 知道 在 dir 后 边 加 上 一 对 括号 可 以 执行 dirO 
WEK, 如 果 不 加 括号 会 如 何 ? 试 一 试 。 解释 器 返回 给 你 什么 信息 ? 你 认为 这 个 信息 表 
示 什 么 意思 ? 

(c) typeO ARN RHEE Python 对 象 做 为 参数 并 返回 他 们 的 类 型 。 在 解释 器 中 键 
人 type(di), 看 看 你 得 到 的 是 什么 ? 

(D 本 练习 的 最 后 一 部 分 ， 我 们 来 瞧 一 瞧 Python 的 文档 字符 串 。 通过 dir. doc ”可 
以 访问 dir OVI EKZ CPS FER, print dir._doc。_ 可 以 显示 这 个 字符 串 的 内 容 。 许多 内 建 
函数 ， 方 法 ， 模 块 及 模块 属性 都 有 相应 的 文档 字符 串 。 我 们 希望 你 在 你 的 代码 中 也 要 书 把 文档 
FEP, 它 会 对 使 用 这 些 代 码 的 人 提供 及 时 方便 的 帮助 。 









































































































































2-13. 利用 dirO RHE sys 模块 中 更 多 的 东西 。 
(a) 局 动 Python 交互 解释 器 ， 执 行 dirO 函 数 ， 然 后 键入 import sys USA sys 模块 。 
次 执行 dirO 函 数 以 确认 sys 模块 被 正确 的 导入 。 然后 执行 dir(sys) ， 你 就 可 以 看 到 sys 


































































































这 个 属性 是 sys 模块 的 。 其 中 version 变量 保存 着 你 使 用 的 Python 解释 器 版 本 ， platform 
属性 则 包含 你 运行 Python 时 使 用 的 计算 机 平台 信息 。 
(c) 最 后 ， 调用 sys.exitO 函数 。 这 是 一 种 热 键 之 外 的 另 一 种 退出 Python 解释 器 的 方 





模块 的 所 有 属性 了 。 
(b) 显示 sys 模块 的 版 本 号 属性 及 平台 变量 。 记 住 在 属性 名 前 一 定 要 加 sys. ， 这 表示 E: 






































No 
2-14. BE24/)7 print 语句 里 的 算术 表达 式 ， 试 着 在 这 个 表达 式 中 添加 合适 的 
括号 以 便 它 能 正常 工作 。 








2-15. = 元素 排序 

(a) 让 用 户 输 入 三 个 数值 并 将 分 别 将 它们 保存 到 3 个 不 同 的 变量 中 ,不 使 用 列表 或 排序 算法 ， 
己 守 代码 来 对 这 三 个 数 由 小 到 大 排序 。(p) 修 改 (a) 的 解决 方案 ,使 之 从 大 到 小 排序 

2-16. ”文件 

键入 2.15 方 的 文件 显示 的 代码 ， 然后 运行 它 ， 看 看 能 人 耕 在 你 的 系统 上 正常 工作 ， 然 后 试 
一 下 其 它 的 输入 文件 。 
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dim 
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本 章 主题 

e 语句 和 语法 
e 变量 赋值 

@ 标识 符 和 关键 字 
@ 基本 风格 指南 

@ 内 存 管理 

@ 第 一 个 Python 程序 
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我 们 下 一 个 目标 是 了 解 基 本 的 Python 语法 ， 介 绍 一 些 基本 的 编程 风格 ， 之 后 简要 介绍 一 
下 标识 符 、 变 量 和 关键 字 。 我 们 也 会 讨论 变量 占用 的 内 存 是 如 何 分 配 和 回收 的 。 最 后 ， 我 们 会 
给 出 一 个 较 大 的 Python 样 例 程 序 ， 让 你 实际 体验 一 下 这 些 特性 。 无 须 担 心 ， 在 你 畅游 Python 
的 过 程 中 有 很 多 救生 员 在 保护 着 你 。 


3.1 语句 和 语法 

python 语句 中 有 一 些 基 本 规则 和 特殊 字符 : 
井 号 划 表 示 之 后 的 字符 为 Python 注释 
换行 An) 是 标准 的 行 分 隔 符 〈 通 常 一 个 语句 一 行 ) 
EE CN) 继续 上 一 行 

分 号 C; ) 将 两 个 语句 连接 在 一 行 中 
冒号 ( : ) 将 代码 块 的 头 和 体 分 开 
语句 (代码 块 ) 用 缩 进 块 的 方式 体现 
不 同 的 缩 进深 度 分 隔 不 同 的 代码 块 
Python 文件 以 模块 的 形式 组 织 

3.1.1 ”注释 (# ) 




















dim 
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是 : 尽管 Python 是 可 读 性 最 好 的 语言 之 一 ， 这 并 不 意味 着 程序 员 在 代码 中 








首要 说 明 的 事情 
就 可 以 不 写 注 释 。 和 很 多 Unix 脚本 类 似 ，Python 注释 语句 从 # 字符 开始 ， 注 释 可 以 在 一 行 


的 任何 地 方 开 始 ， 解 释 器 会 忽略 掉 该 行 # 之 后 的 所 有 内 容 。 要 正确 的 使 用 注释 。 


3.1.2 继续 (\ ) 


Python 语句 ， 一 般 使 用 换行 分 隔 ， 也 就 是 说 一 行 一 个 语句 
ALC \ ) 分 解 成 几 行 ， 如 下 例 : 


























。 一 行 过 长 的 语句 可 以 使 用 反射 


# check conditions 

if (weather is hot == 1) and | 
(shark warnings == 0): 

send goto beach mesg to pager 0) 





有 两 种 例外 情况 一 个 语句 不 使 用 反 斜 线 也 可 以 跨行 。 在 使 用 闭合 操作 符 时 ， 单 一 语句 可 以 
跨 多 行 ， 例 如 : 在 含有 小 括号 、 中 括号 、 花 括号 时 可 以 多 行书 号。 另外 就 是 三 引号 包括 下 的 字 














符 串 也 可 以 跨行 书写 。 如 下 例 : 


# display a string with triple quotes 
print’’’hi there, this is a long message for you 


that goes over multiple lines... you will find 
out soon that triple quotes in Python allows 
this kind of fun! it is like a day on the beach!’’’ 


# set some variables 
go surf, get a tan while, boat size, toll money = (1, windsurfing’, 40.0, -2. 00) 


如 果 要 在 使 用 反 斜 线 换行 和 使 用 括号 元 素 换行 作 一 个 选择 ， 我 们 推荐 使 用 括号 ， 这 样 可 读 
性 会 更 好 。 
3.1.3 多 个 语句 构成 代码 组 (:) : 


缩 进 相同 的 一 组 语句 构成 一 个 代码 块 ， 我 们 称 之 代码 组 。 像 if. while. def 和 class 这 样 
首 行 以 关键 字 开 始 ， 以 冒号 ( : ) 结 束 ， 该 行 之 后 的 一 行 或 多 行 代码 构成 代码 组 。 

















的 复合 语句 ， 
我 们 将 首 行 及 后 面 的 代码 组 称 为 一 个 子 句 (clause)。 


$ —o— — 
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dim 
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3.1.4 代码 组 由 不 同 的 缩 进 分 隔 


我 们 在 章节 2.10 中 曾 提 到 ，Python 使 用 缩 进来 分 隔 代码 组 。 代 码 的 层次 关系 是 通过 同样 
深度 的 空格 或 制 表 符 缩 进 体现 的 。 同 一 代码 组 的 代码 行 必 须 严 格 左 对 齐 〈 左 边 有 同样 多 的 空格 
或 同样 多 的 制 表 符 ) ， 如 果 不 严 格 遵 守 这 个 规则 ， 同 一 组 的 代码 就 可 能 被 当成 另 一 个 组 ， 甚 至 


会 导致 语法 错误 。 


























核心 风格 : 缩 进 四 个 空格 宽度 ， 避 免 使 用 制 表 符 

对 一 个 初次 使 用 空白 字符 作为 代码 块 分 界 的 人 来 说 ， 遇 到 的 第 一 个 问题 是 : 缩 进 多 大 宽度 
才 合 适 ? 两 个 太 少 ， 六 到 八 个 又 太 多 ， 因 此 我 们 推荐 使 用 四 个 空格 宽度 。 需 要 说 明 一 点 ， 不 同 
的 文本 编辑 器 中 制 表 符 代表 的 空白 宽度 不 一 ， 如 果 你 的 代码 要 跨 平 台 应 用 ， 或 者 会 被 不 同 的 编 
辑 器 读 写 ,建议 你 不 要 使 用 制 表 符 。 使 用 空格 或 制 表 符 这 两 种 风格 都 得 到 了 Python 创始 人 Guido 
van Rossum 的 支持 ， 并 被 收录 到 Python 代码 风格 指南 文档 。 在 本 章 第 3. 4 小节 中 你 会 看 到 同 
样 的 建议 。 





随 着 见 进深 上 度 的 增加 ， 代 码 块 的 层次 也 在 加 深 , WAFER ISR RIAN, FIA AKL 
脚本 的 “main” 部 分 。 

使 用 缩 进 对 齐 这 种 方式 组 织 代码 ， 不 但 代码 风格 优雅 ， 而 且 也 大 大 提高 了 代码 的 可 读 性 。 
而 且 它 有 效 的 避免 了 “ 甚 挂 else" Cdangling-else) 问题 ， 和 未 写 大 括号 的 单一 子 句 问题 。 (如 
R OC 语言 中 if 语句 没 写 大 括号 ， 而 后 面 却 跟着 两 个 缩 近 的 语句 ， 这 会 造成 不 论 条 件 表达 式 是 
否 成 立 ， 第 二 个 语句 总 会 执行 。 这 种 问题 很 难 调试 ， 不 知道 困惑 了 多 少 程序 员 。) 
































最 后 一 点 ， 由 于 Python 只 使 用 缩 进 方式 表达 代码 块 逻辑 ,因此 “神圣 的 大 括号 战争 ”永远 
不 会 发 生 在 Python 身上 。C、C+r+ 和 Java 语言 中 ， 开 始 大 括号 可 以 在 第 一 行 的 尾部 ， 也 可 以 在 
第 二 行 的 头 部 ， 也 可 以 在 第 二 行 空 几 格 后 开始 ， 这 就 造成 不 同 的 人 选择 不 同 的 风格 ， 于 是 你 就 
会 看 到 大 括号 战争 的 场景 了 。 


3.1.5 ”同一 行书 写 多 个 语句 (;) 


分 号 ( ; ) 允许 你 将 多 个 语句 写 在 同一 行 上 ， 语 句 之 间 用 分 号 阳 开 ， 而 这 些 语句 也 不 能 在 这 
行 开始 一 个 新 的 代码 块 。 这 里 有 一 个 例子 : 
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import sys; x = 'foo'; sys.stdout.write(x + '|n) 


必须 指出 一 点 ， 同一 行 上 书写 多 个 语句 会 大 大 降低 代码 的 可 读 性 ，Python 虽然 允许 但 不 
提倡 你 这 么 做 。 


3.1.6 ”模块 


每 一 个 Python 脚本 文件 都 可 以 被 当成 是 一 个 模块 。 模块 以 磁盘 文件 的 形式 存在 。 当 一 个 模 
块 变 得 过 大 ， 并 且 驱 动 了 太 多 功能 的 话 ， 就 应 该 考虑 拆 一 些 代码 出 来 男 外 建 一 个 模块 。 模 块 里 
的 代码 可 以 是 一 段 直接 执行 的 脚本 ， 也 可 以 是 一 堆 类 似 库 函数 的 代码 ， 从 而 可 以 被 别 的 模块 导 
入 (import) 调用 。 记 得 我 们 在 上 一 章 中 曾 提 到 过 ， 模 块 可 以 包含 直接 运行 的 代码 块 、 类 定义 、 
函数 定义 或 这 几 者 的 组 合 。 


3. 2 变量 赋值 
本 节 主 题 是 变量 赋值 。 我 们 将 在 3. 3 小 节 中 讨论 什么 样 的 标识 符 才 是 合法 的 变量 名 。 























赋值 运算 符 











Python 语言 中 ， 等 号 (=) 是 主要 的 赋值 运算 符 。《〈 其 他 的 是 增 量 赋值 运算 符 ， 参 见 下 节 ) 





anint = -12 

aString = ‘cart’ 

aFloat = -9 1415 * (5.0 ** 2) 

anotherString = 'shop' + 'ping' 

alist = [3. 14e10, 'Znd elmt of a list’, 8 82-4. 871j] 


注意 , 赋值 并 不 是 直接 将 一 个 值 赋 给 一 个 变量 ， 尽管 你 可 能 根据 其 它 语言 编程 经 验 认 为 应 
该 如 此 。 在 Python 语言 中 ， 对 象 是 通过 引用 传递 的 。 在 赋值 时 ， 不 管 这 个 对 象 是 新 创建 的 ， 还 
是 一 个 已 经 存在 的 ， 都 是 将 该 对 象 的 引用 《并 不 是 值 ) 赋值 给 变量 。 如 果 此 刻 你 还 不 是 100% 理 
解 清楚 ， 也 不 用 着 急 。 在 本 章 的 后 面部 分 ， 我 们 还 会 再 讨论 这 个 话题 ， 现在 你 只 需要 有 这 人 么 
一 个 概念 即 可 。 


E 


























同样 的 ， 如 果 你 比较 熟悉 C， 你 会 知道 赋值 语句 其 实 是 被 当成 一 个 表达 式 ( 可 以 返回 值 )。 
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这 条 并 不 适合 于 Python, Python 的 赋值 语句 不 会 返回 值 。 类 似 下 面 的 语句 在 Python 中 是 


tts 


D> x = 1 


> y= w&=xt+h) # assignments not expressions! File “<stdin>”, line 1 


y= w=xtlh) 


SyntaxError: invalid syntax 








链 式 赋 值 没 问 题 ， 看 《本 章 稍 后 部 分 会 给 出 更 多 的 例子 ) : 


M^y-"xrx-xt*l 
222 X, y 
(2, 2) 





增 量 赋值 











从 Python 2.0 开始 ， 等 号 可 以 和 一 个 算术 运算 符 组 合 在 一 起 ， 
左边 的 变量 。 这 被 称 为 增 量 赋值， 类 似 下 面 这 样 的 语句 : 





xX-x*l 


现在 可 以 被 写成 : 


x t= 1 





增 量 赋值 通过 使 用 赋值 运算 符 ， 将 数学 运算 隐藏 在 赋值 过 程 当中 。 





Java， 会 觉得 下 面 的 运算 符 很 熟悉 。 











+- > 


将 计算 结果 重新 赋值 给 


如 果 您 用 过 C、C++ 或 者 


增 量 赋值 相对 普通 赋值 不 仅仅 是 写法 上 的 改变 ， 最 有 意义 的 变化 是 第 一 个 对 象 〈 我 们 例子 


中 的 A) 仅 被 处 理 一 次 。 可 变 对 象 会 被 就 地 修改 〈 无 修 捞 贝 引用 ) ， 不 可 变 对 象 则 和 A = A + 


© 
e 


一 全 
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mk 


B 的 结果 一 样 〈 分 配 一 个 新 对 象 ) ， 我 们 前 面 提 到 过 ， 有 一 个 例外 就 是 A 仅 被 求 值 一 次 。 


Z o 


222 m = 12 

225 m %= 7 

>> m 

5 

225 m ¥¥= 2 

222 m 

25 

2» alist = [123, 'xyz'] 
2» alist += [45. 6e7] 
2225 alist 

[123, 'xyz', 456000000. 0] 


Python 不 支持 类 似 x+ 或 --x 这 样 的 前 置 /后 置 自 寺 











首 / 自 减 运算 。 








多 重 赋值 


MPx-y-z-l 
222 x 

1 

202 y 

1 

D> z 

1 





在 上 面 的 例子 中 ， 一 个 值 为 1 的 整数 对 象 被 创建 ， 该 对 象 的 同一 个 引用 被 赋值 给 x. y 和 


可 以 的 。 


语 ， 





€€ 多 元 ” 赋值 


也 就 是 将 一 个 对 象 赋 给 了 多 个 变量 。 当 然 ， 在 Python 当中 ， 将 多 个 对 象 赋 给 多 个 变量 也 是 


另 一 种 将 多 个 变量 同时 赋值 的 方法 我 们 称 为 多 元 赋值 (nultuple) 。 这 不 是 官方 Python 术 
而 是 我 们 将 “mul-tuple“ 连 在 一 起 自 造 的 。 因 为 采用 这 种 方式 赋值 时 ， 
都 是 元 组 (我 们 在 2. 8 节 讲 过 元 组 是 一 种 Python 基本 数据 类 型 ) 。 





> x, 2=1 2, a string’ 
D»»> x 


+- > 
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等 号 两 边 的 对 象 








dim 





E 
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222 y 

2 

D> Z 

'a string’ 


在 上 面 的 例子 里 ， 两 个 整数 对 象 〈 值 分 别 为 1 和 20 及 一 个 字符 串 对 象 ， 被 分 别 赋值 给 
x, y 和 zz。 通常 元 组 需要 用 圆 括 号 (小 括号 ) 插 起 来 ， 尽 管 它 们 是 可 选 的 。 我 们 建议 总 是 加 上 
圆 括号 以 使 得 你 的 代码 有 更 高 的 可 读 性 。 














> (y y, 2) = (0, 2 ’a string’) 





在 其 它 类 似 C 的 语言 中 ， 如 果 你 要 交换 两 个 值 ， 你 会 想到 使 用 一 个 临时 变量 比如 tmp 来 
临时 保存 其 中 一 个 值 : 


/* CUB EPAPER S 


tmp = X; 
x = yy 
y = tmp; 


在 上 面 的 C 代码 片段 中 ， 变 量 x 和 变量 y 的 值 被 互相 交换 。 临时 变量 tmp 用 于 在 将 y WA 
值 给 x 前 先 保存 x 的 值 。 将 y WERS x 之 后 ， 才 可 以 将 保存 在 tmp 变量 中 的 x 的 值 赋 给 y。 
Python 的 多 元 赋值 方式 可 以 实现 无 需 中 间 变 量 交 换 两 个 变量 的 值 。 








# swapping variables in Python 
D> x, y=, 2 
222 x 

1 

202 y 

2 

D> X% = X 
222 x 

2 

202 y 

1 


显然 ， Python 在 赋值 之 前 已 经 事先 对 x 和 y 的 新 值 做 了 计算 。 
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3.3 标识 符 








标识 符 是 电脑 语言 中 允许 作为 名 字 的 有 效 字 符 串 集合 。 其 中 ， 有 一 部 分 是 关键 字 ， 构 成 语 
言 的 标识 符 。 这 样 的 标识 符 是 不 能 做 它 用 的 标识 符 的 ， 否 则 会 引起 语法 错误 (SyntaxError & 
A 
T) o 

















Python WARN built-in 标识 符 集 合 ， 虽 然 它们 不 是 保留 字 ， 但 是 不 推荐 使 用 这 些 特别 
的 名 字 ( 见 3.3.3) 。 


3.3.1 合法 的 Python 标识 符 

Python 标识 符 字 符 串 规 则 和 其 他 大 部 分 用 C 编写 的 高 级 语言 相似 : 
e 第 一 个 字符 必须 是 字母 或 下 划 线 (_) 

o 剩 下 的 字符 可 以 是 字母 和 数字 或 下 划 线 

e 大 小 写 敏感 


























标识 符 不 能 以 数字 开头 ; 除了 下 划 线 ， 其 他 的 符号 都 不 允许 使 用 。 处 理 下 划 线 最 简单 的 方 
法 是 把 它们 当成 字母 字符 。 大 小 写 敏 感 意味 着 标识 符 foo 不 同 于 Foo, 而 这 两 者 也 不 同 于 F00。 


3.3.2 ”关键 字 
Python 的 关键 字 列 在 表 3. 1 中 。 一 般 来 说 ， 任 何 语言 的 关键 字 应 该 保持 相对 的 稳定 ， 但 是 


因为 Python 是 一 门 不 断 成 长 和 进化 的 语言 ， 关 键 字 列 表 和 iskeyword() 函数 都 放 入 了 keyword 
模块 以 便 查 阅 。 




















dim 








> -$ 
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ee 
T 





Table 3.1 Python Keywords* 


| 





ss = 
sim = 
a. 从 Pythonl. 4 开始 关键 字 access 就 被 废除 了 

b.  Python2. 6 时 加 入 

C. Pythonl. 5 时 加 入 


d.  Python2. 3 时 加 入 


$ E Python2. 4 中 非 关键 字 常 量 . 
3.3.3 A 


除了 关键 字 之 外 ，Python 还 有 可 以 在 任何 一 级 代码 使 用 的 “内 建 ” 的 名 字 集 合 ， 这 些 名 字 
可 以 由 解释 器 设置 或 使 用 。 虽 然 built-in 不 是 关键 字 , 但 是 应 该 把 它 当 作 “ 系 统 保留 字 ”, 不 
做 他 用 。 然而， 有 些 情况 要 求 履 盖 (也 就 是 : BEL, BK) EM. Python 不 支持 重 载 标识 符 ， 
所 以 任何 时 刻 都 只 有 一 个 名 字 绑 定 。 




















我 们 还 可 以 告诉 高 级 读者 built-in builtins 模块 的 成 员 , 在 你 的 程序 开始 或 在 交互 
解释 器 中 给 出 >>> 提 示 之 前 ， 由 解释 器 自动 导入 的 。 把 它们 看 成 适用 在 任何 一 级 Python 代码 的 
全 局 变量 。 


3.3.4 专用 下 划 线 标识 符 


Python 用 下 划 线 作为 变量 前 级 和 后 缀 指定 特殊 变量 。 稍 后 我 们 会 发 现 ， 对 于 程序 来 说， 其 
中 的 有 些 变 量 是 非常 有 用 的 , 而 其 他 的 则 是 未 知 或 无 用 的 。 这 里 对 Python 中 下 划 线 的 特殊 用 法 





dim 
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做 了 总 结 : 


e xxx ASFA’ from module import * 导入 
e xxx ”系统 定义 名 字 


e xx 类 中 的 私有 变量 











核心 风格 : 避免 用 下 划 线 作为 变量 名 的 开始 

因为 下 划 线 对 解释 器 有 特殊 的 意义 ， 而 且 是 内 建 标识 符 所 使 用 的 符号 ， 我 们 建议 程序 员 避 
免 用 下 划 线 作为 变量 名 的 开始 。 一 般 来 讲 ， 变 量 名 _xxx 被 看 作 是 “私有 的 ”， 在 模块 或 类 外 不 
可 以 使 用 。 当 变量 是 私有 的 时 候 ， 用 _xxx 来 表示 变量 是 很 好 的 习惯 。 因 为 变量 名 xxx OX 
Python 来 说 有 特殊 含义 ， 对 于 普通 的 变量 应 当 避 免 这 种 命名 风格 。 


3.4 基本 风格 指南 


注释 
注释 对 于 自己 和 后 来 人 来 说 都 是 非常 重要 的 ， 特 别 是 对 那些 很 久 没有 被 动 过 的 代码 而 言 ， 




















注释 更 显得 有 用 了 。 既 不 能 缺少 注释 ， 也 不 能 过 度 使 用 注释 。 尽 可 能 使 注释 简洁 明了 ， 并 放 在 
最 合适 的 地 方 。 这 样 注释 便 为 每 个 人 节省 了 时 间 和 精力 。 记 住 ， 要 确保 注释 的 准确 性 。 











文档 

Python 还 提供 了 一 个 机 制 ， 可 以 通过 _doc_ 特 别 变量 ， 动 态 获得 文档 字 串 。 在 模块 ， 类 
声明 ， 或 函数 声明 中 第 一 个 没有 赋值 的 字符 串 可 以 用 属性 obj. doc 来 进行 访问 ， 其 中 obj 
是 一 个 模块 ， 类 ， 或 函数 的 名 字 。 这 在 运行 时 刻 也 可 以 运行 。 
































缩 进 
因为 缩 进 对 齐 有 非常 重要 的 作用 ， 您 得 考虑 用 什么 样 的 缩 进 风格 才 证 代码 容易 阅读 。 在 选 
择 要 空 的 格 数 的 时 候 ， 常 识 也 起 着 非常 大 的 作用 。 





























1 或 2 可 能 不 够 ， 很 难 确 定 代码 语句 属于 哪个 块 

8 至 10 可 能 太 多 ， 如 果 代 码 内 和 嵌 的 层次 太 多 ， 就 会 使 得 代码 很 难 阅读 。 四 个 空格 非常 的 
流行 ,更 不 用 说 Python 的 创造 者 也 支持 这 种 风格 。 五 和 六 个 也 不 坏 , 但 是 文本 编辑 器 通常 不 文 
持 这 样 的 设置 ， 所 以 也 不 经 常 使 用 。 三 个 和 七 个 是 边界 情况 。 


E 









































os 
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当 使 用 制 表 符 Tab 的 时 候 ， 请 记 住 不 同 的 文本 编辑 器 对 它 的 设置 是 不 一 样 。 推 荐 您 不 要 
使 用 Tab， 如 果 您 的 代码 会 存在 并 运行 在 不 同 的 平台 上 ， 或 者 会 用 不 同 的 文本 编辑 器 打开 ， 推 
荐 您 不 要 使 用 Tab。 

















选择 标识 符 名 称 

好 的 判断 也 适用 于 选择 标志 符 名 称 ， 请 为 变量 选择 短 而 意义 丰富 的 标识 符 。 虽 然 变量 名 的 
长 度 对 于 今天 的 编程 语言 不 再 是 一 个 问题 ， 但 是 使 用 简短 的 名 字 依 然 是 个 好 习惯 ， 这 个 原则 同 
样 使 用 于 模块 (Python 文件 ) 的 命名 。 














Python 风格 指南 











Guido van Rossum 在 多 年 前 写 下 Python 代码 风格 指南 。 目前 它 已 经 被 至 少 三 个 PEP I: 
7 (C 代码 风格 指南 ) 、8 (Python 代码 风格 指南 ) 和 257 文档 字 符 串 规范 ) 。 这 些 PEP 被 归 





档 、 维 护 并 定期 更 新 。 
$ 渐渐 的 ， 你 会 听 到 “Pythonic” 这 个 术语 ， 它 指 的 是 以 Python 的 方式 去 编写 代码 、 组 织 
逻辑 ， 及 对 象 行为 。 更 多 时 间 过 后 ， 你 才 会 真正 理解 它 的 含义 。PEP 20 写 的 是 Python 之 禅 ， 
你 可 以 从 那里 开始 你 探索 “Pythonic” 真 正 含义 的 旅程 .如 果 你 不 能 上 网 , 但 想 看 到 这 篇 诗句 ， 
那 就 从 你 的 Python 解释 器 输入 import this 然后 回 车 。 下 面 是 一 些 网 上 资源 : 
www. Python. org/doc/essays/styleguide. html 

















www. Python. org/dev/peps/pep-0007/ 
www. Python. org/dev/peps/pep-0008/ 
www. Python. org/dev/peps/pep-0020/ 
www. Python. org/dev/peps/pep-0257/ 


3.4.1. 模块 结构 和 布局 


用 模块 来 合理 组 织 你 的 Python 代码 是 简单 又 自然 的 方法 。 你 应 该 建立 一 种 统一 且 容 易 阅读 
的 结构 ， 并 将 它 应 用 到 每 一 个 文件 中 去 。 下 面 就 是 一 种 非常 合理 的 布局 : 

# (1) 起 始 行 (Unix) 

# (2) 模块 文档 


4 . 
$— —$— 一 人 | e 
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# (3) 模块 导入 
# (4) 变量 定 》 
# (5) 类 定义 
# (6) 函数 定义 

# (7) 主 程序 

3- 1 一 个 典型 模块 的 内 部 结构 图 解 。 











(1) 起 始 行 
通常 只 有 在 类 Unix 环境 下 才 使 用 起 始 行 ， 有 起 始 行 就 能 够 仅 输 入 脚本 名 字 来 执行 脚本 ,无 





























需 直 接 调用 解释 器 。 
(2) 模块 文档 
简要 介绍 模块 的 功能 及 重要 全 局 变量 的 含义 ， 模 块 外 可 通过 module. doc ”访问 这 些 内 
容 。 
(3) 模 块 导入 
导入 当前 模块 的 代码 需要 的 所 有 模块 ;每 个 模块 仅 导 入 一 次 《当前 模块 被 加 载 时 ) ; 函数 
内 部 的 模块 导入 代码 不 会 被 执行 ， 除非 该 函数 正在 执行 。 
(4) 变量 定义 
这 里 定义 的 变量 为 全 局 变量 , 本 模块 中 的 所 有 函数 都 可 直接 使 用 。 从 好 的 编程 风格 角度 说 ， 


























除非 必须 ， 和 否则 就 要 尽量 使 用 局 部 变量 代替 全 局 变量 ， 如 果 坚 持 这 样 做 ， 你 的 代码 就 不 但 容易 
维护 ， 而 且 还 可 以 提高 性 能 并 节省 内 存 。 

(5) 类 定义 语句 

所 有 的 类 都 需要 在 这 里 定义 。 当 模块 被 导入 时 class 语句 会 被 执行 ， 类 也 就 会 被 定义 。 类 
的 文档 变量 是 class. doc _ 

(6) 函数 定义 语句 

此 处 定义 的 函数 可 以 通过 module. function (在 外 部 被 访问 到 ， 当 模块 被 导入 时 def 语句 
会 被 执行 ， 函数 也 就 都 会 定义 好 ， 函 数 的 文档 变量 是 function. doc . 

(7) 主 程序 

无 论 这 个 模块 是 被 别 的 模块 导入 还 是 作为 脚本 直接 执行 ， 都 会 执行 这 部 分 代码 。 通 常 这 里 
不 会 有 太 多 功能 性 代码 ， 而 是 根据 执行 的 模式 调用 不 同 的 函数 。 
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(1) Startup line (Unix) 


(2) Module documentation 


(3) Module imports 


(4) (Global) Variable declarations 


class FooClass (object): 
'Foo class" (5) Class declarations (if any) 
pass 


def test(): 
"test function" 
foo = FooClass() (6) Function declarations (if any) 
if debug: 
print 'ran test()' 


Tf name —— c my 


EE 0 (7) *main" body 





Figure 3—1 Typical Python file structure 


推荐 代码 风格 : 主 程序 调用 mainO 函数 

主 程序 代码 通常 都 和 你 前 面 看 到 的 代码 相似 ， 检 查 _name_ “变量 的 值 然 后 再 执行 相应 的 
调用 参阅 下 一 页 的 核心 笔记 ) 。 主 程序 中 的 代码 通常 包括 变量 赋值 ， 类 定义 和 函数 定义 ， 随 
后 检查 ”name ”来 决定 是 否 调 用 男 一 个 函数 “通常 调用 main( 函数 ) 来 完成 该 模块 的 功能 。 主 
程序 通常 都 是 做 这 些 事 。( 我 们 上 面 的 例子 中 使 用 test 0 而 不 是 main 0 是 为 了 避免 你 在 读 到 核 
心 笔记 前 感到 迷惑 。) 不 管用 什么 名 字 ， 我 们 想 强 调 一 点 那 就 是 : 这 儿 是 放置 测试 代码 的 好 地 
方 。 我 们 在 3. 4. 2 小 节 中 曾经 说 过 ， 大 部 分 的 Python 模块 都 是 用 于 导入 调用 的 ,直接 运行 模块 
应 该 调用 该 模块 的 回归 测试 代码 。 














很 多 项 目 都 是 一 个 主 程序 ， 由 它 导 入 所 有 需要 的 模块 。 所 以 请 记 住 ， 绝 大 部 分 的 模块 创建 
的 目的 是 为 了 被 别人 调用 而 不 是 作为 独立 执行 的 脚本 。 我 们 也 很 可 能 创建 一 个 Python 库 风 格 的 
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模块 ， 这 种 模块 的 创建 目的 就 是 为 了 被 其 他 模块 调用 。 总 之 ， 只 有 一 个 模块 ， 也 就 是 包含 主 程 
序 的 模块 会 被 直接 执行 ， 或 由 用 户 通过 命令 行 执行 ， 或 作为 批 处 理 执行 ， 或 由 Unix cron 任务 
定时 执行 ， 或 通过 Web 服务 器 调用 ， 或 通过 GUI 执行 。 
























































时 刻 记 住 一 个 事实 ， 那 就 是 所 有 的 模块 都 有 能 力 来 执行 代码 。 最 高 级 别 的 Python 语句 一 一 
也 就 是 说 ， 那些 没有 缩 进 的 代码 行 在 模块 被 导入 时 就 会 执行 ， 不 管 是 不 是 真 的 需要 执行 。 由 
于 有 这 样 一 个 “特性 ”， 比 较 安 全 的 写 代码 的 方式 就 是 除了 那些 真正 需要 执行 的 代码 以 外 ， JL 
乎 所 有 的 功能 代码 都 在 函数 当中 。 再 说 一 裔 ， 通 常 只 有 主 程序 模块 中 有 大 量 的 顶级 可 执行 代码 ， 
所 有 其 它 被 导入 的 模块 只 应 该 有 很 少 的 顶级 执行 代码 ， 所 有 的 功能 代码 都 应 该 封装 在 函数 或 类 
当中 。 

































































(参阅 核心 笔记 了 解 更 多 信息 ) 

核心 笔记 ^ name _ 指示 模块 应 如 何 被 加 载 

由 于 主 程序 代码 无 论 模块 是 被 导入 还 是 被 直接 执行 都 会 运行 ， 我 们 必须 知道 模块 如 何 决 定 
运行 方向 。 一 个 应 用 程序 可 能 需要 导入 另 一 个 应 用 程序 的 一 个 模块 ， 以 便 重 用 一 些 有 用 的 代码 
《否则 就 只 能 用 拷贝 粘贴 那 种 非 面向 对 象 的 轧 夸 手段 〉。 这 种 情况 下 ,你 只 想 访问 那些 位 于 其 
它 应 用 程序 中 的 代码 ， 而 不 是 想 运行 那个 应 用 程序 。 因 此 一 个 问题 出 现 了 ，“Python 是 否 
一 种 方法 能 在 运行 时 检测 该 模块 是 被 导入 还 是 被 直接 执行 昵 ? ” 答案 就 是 ...... (HE E 
动 )..... 没 错 ! ^ name 系统 变量 就 是 正确 答案 。 


如 果 模 块 是 被 导入 ， ^ nam 的 值 为 模块 名 字 
如 果 模 块 是 被 直接 执行 ， name 的 值 为 ” main ' 


3.4.2 在 主 程序 中 书写 测试 代码 


优秀 的 程序 员 和 软件 工程 师 ， 总 是 会 为 我 们 的 应 用 程序 提供 一 组 测试 代码 或 者 简单 教程 。 
对 那些 仅仅 为 了 让 别 的 程序 导入 而 创建 的 模块 来 说 ， Python 有 效 的 简化 了 这 个 任务 。 这 些 模 
块 理论 上 永远 不 会 被 直接 执行 ， 那么 ， 在 这 个 模块 被 直接 执行 时 进行 系统 测试 岂 不 妙 哉 ? E 
置 起 来 难 吗 ? 一 点 儿 也 不 。 









































测试 代码 仅 当 该 文件 被 直接 执行 时 运行 ， 也 就 是 说 不 是 被 别 的 模块 导入 时 。 上 文 及 核心 笔 
记 中 提 到 如 何 判断 一 个 模块 是 被 直接 运行 还 是 被 导入 。 我 们 应 该 利用 — name _ 变量 这 个 有 利 
条 件 , 将 测试 代码 放 在 一 个 或 者 叫 main@O ， 或 者 叫 test O (或 者 你 随便 取 个 啥 名 字 ) 的 函数 中 ， 
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如 果 该 模块 是 被 当成 脚本 运行 ， 就 调用 这 个 函数 。 


这 些 测试 代码 应 该 随 着 测试 条 件 及 测试 结果 的 变更 及 时 修改 ， 每 次 代码 更 新 都 应 该 运行 这 
些 测试 代码 ， 以 确认 修改 没有 引发 新 问题 。 只 要 坚持 这 样 做 ， 你 的 代码 就 会 足够 健壮 ， 更 不 用 
提 验 证 和 测试 新 特性 和 更 新 了 。 
































在 主 程序 中 放置 测试 代码 是 测试 模块 的 简单 快捷 的 手段 。Python 标准 库 中 还 提供 了 
unittest 模块 ， 有 时 候 它 被 称 为 PyUnit， 是 一 个 测试 框架 。 如 何 使 用 unittest 超出 了 本 书 
的 范围 ， 不 过 当 需 要 对 一 个 大 系统 的 组 件 进行 正规 系统 的 回 规 测试 时 ， 它 就 会 派 上 用 场 。 




















3.5 内 存 管理 
到 现在 为 止 ， 你 已 经 看 了 不 少 Python 代码 的 例子 。 我 们 本 节 的 主题 是 变量 和 内 存 管理 的 
细节 ， 包括 : 


e 变量 无 须 事先 声明 
e. 变量 无 须 指 定 类 型 
e 程序 员 不 用 关心 内 存 管理 
e 变量 名 会 被 “回收 ” 
e del 语句 能 够 直接 释放 资源 























3.5.1 ”变量 定义 


大 多 数 编译 型 语言 ， 变 量 在 使 用 前 必须 先 声 明 ， 其 中 的 语言 更 加 苛刻 : 变量 声明 必须 位 
于 代码 块 最 开始 ， 且 在 任何 其 他 语句 之 前 。 其 它 语言 ， 像 C++ 和 Java， 人 允许 “随时 随地 ”声明 
变量 ， 比 如 ， 变 量 声 明 可 以 在 代码 块 的 中 间 ， 不 过 仍然 必须 在 变量 被 使 用 前 声明 变量 的 名 字 和 
类 型 。 在 Python 中， 无 需 此 类 显 式 变量 声明 语句 ， 变 量 在 第 一 次 被 赋值 时 自动 声明 。 和 其 他 大 
多 数 语言 一 样 ， 变 量 只 有 被 创建 和 赋值 后 才能 被 使 用 。 





























2a 

Traceback (innermost last): 
File “stdin, line L in ? 
NameError: a 
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> -$ 


dim 
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变量 一 旦 被 赋值 ， 您 就 可 以 通过 变量 名 来 访问 它 。 


D> xX =4 

> y = ‘this is a string 
222 x 

4 

222 y 

"this is a string’ 


3.5.2 动态 类 型 

















还 要 注意 一 点 ,Python 中 不 但 变量 名 无 需 事先 声明 , 而 且 也 无 需 类 型 声明 .Python 语言 中 ， 





对 象 的 类 型 和 内 存 占用 都 是 运行 时 胡 
型 语言 。 在 创建 一 一 也 就 是 赋值 时 ， 











上 定 的 。 尽 管 代 码 被 编译 成 字 节 码 ，Python 仍然 是 一 种 解释 
解释 器 会 根据 语法 和 右 侧 的 操作 数 来 决定 新 对 象 的 类 型 。 














在 对 象 创建 后 ， 一 个 该 对 象 的 应 用 会 被 赋值 给 左 侧 的 变量 。 





$ 3.5.3 内 存 分 配 


作为 一 个 负责 任 的 程序 员 ， 我 们 知道 在 为 变量 分 配 内 存 时 ， 是 在 借用 系统 资源 ， 在 用 完 之 
后 ， 应 该 释放 借用 的 系统 资源 。Python 解释 器 承担 了 内 存 管理 的 复杂 任务 ， 这 大 大 简化 了 应 
用 程序 的 编写 。 你 只 需要 关心 你 要 解决 的 问题 ， 至 于 底层 的 事情 放心 交 给 Python 解释 器 去 做 就 











行 了 。 


3.5.4 引用 计数 


























要 保持 追踪 内 存 中 的 对 象 ， Python 使 用 了 引用 计数 这 一 简单 技术 。 也 就 是 说 Python 内 部 





记录 着 所 有 使 用 中 的 对 象 各 有 和 多少 引用 。 你 可 以 将 它 想像 成 扑克 牌 游戏 “ 黑 杰 克 ” 或 “21 点 ”。 
一 个 内 部 跟踪 变量 ， 称 为 一 个 引用 计数 器 。 至 于 每 个 对 象 各 有 多 少 个 引用 ， 简称 引用 计数 。 当 
对 象 被 创建 时 ， 就 创建 了 一 个 引用 计数 ， 当 这 个 对 象 不 再 需要 时 ， 也 就 是 说 ， 这 个 对 象 的 
引用 计数 变 为 0 时 ， 它 被 垃圾 回收 。《 严 格 来 说 这 不 是 100% 正 确 ， 不 过 现 阶段 你 可 以 就 这 人 么 








认为 ) 


增加 引用 计数 























aa Bi 
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dim 
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T | 


当 对 象 被 创建 并 《将 其 引用 ) 赋值 给 变量 时 ， 该 对 象 的 引用 计数 就 被 设置 为 1。 











当 同一 个 对 象 〈 的 引用 ) 又 被 赋值 给 其 它 变量 时 ， 或 作为 参数 传递 给 函数 ， 方法 或 类 实例 
时 ， 或 者 被 赋值 为 一 个 窗口 对 象 的 成 员 时， 该 对 象 的 一 个 新 的 引用 ， 或 者 称 作 别名 ， 就 被 创建 
( 则 该 对 象 的 引用 计数 自动 加 1) 。 








3-2 有 两 个 引用 的 同一 对 象 


请 看 以 下 声明 : 


x = 3.14 
y=x 


语句 x=3. 14 创建 了 一 个 浮 点 数 对 象 并 将 其 引用 赋值 给 x。 x 是 第 一 个 引用 ， 因此 ， 该 
对 象 的 引用 计数 被 设置 为 1。 语句 y=x 创建 了 一 个 指向 同一 对 象 的 别名 y (参阅 图 3 一 2) 。 事 
实 上 并 没有 为 Y 创 建 一 个 新 对 象 ， 而 是 该 对 象 的 引用 计数 增加 了 1 次 ( 变 成 了 2) 。 这 是 对 象 
引用 计数 增加 的 方式 之 一 。 还 有 一 些 其 它 的 方式 也 能 增加 对 象 的 引用 计数 ， 比如 该 对 象 作 为 参 
数 被 函数 调用 或 这 个 对 象 被 加 入 到 某 个 容器 对 象 当 中 时 。 























总 之 ， 对 象 的 引用 计数 在 





e 对 象 被 创建 
x = 3.14 

e 或 另外 的 别名 被 创建 
y- xX 

e 或 被 作为 参数 传递 给 函数 〈 新 的 本 地 引用 ) 


foobar (x) 





dim 
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e 或 成 为 容器 对 象 的 一 个 元 素 
myList = [123, x, 'xyz'] 


下 面 让 我 们 来 看 一 下 引用 计数 是 如 何 变 少 的 。 


减少 引用 计数 





当 对 象 的 引用 被 销毁 时 ， 引 用 计数 会 减 小 。 最 明显 的 例子 就 是 当 引 用 离开 其 作用 范围 时 ， 
这 种 情况 最 经 常 出 现在 函数 运行 结束 时 ， 所 有 局 部 变量 都 被 自动 销毁 ， 对 象 的 引用 计数 也 就 随 
之 减少 。 























当 变 量 被 赋值 给 另外 一 个 对 象 时 ， 原 对 象 的 引用 计数 也 会 自动 减 1: 


foo = 'xyz' 
bar — foo 
foo = 123 











. TATION ART xyz 被 创建 并 赋值 给 foo 时 ， 它 的 引用 计数 是 1， 当 增加 了 一 个 别名 bar $ 
时 ， 引用 计数 变 成 y 了 2， 不 过 当 foo 被 重新 赋值 给 整数 对 象 123 时 ， xyz 对 象 的 引用 计数 自 
动 减 1， 又 重新 变 成 了 1. 


其 它 造 成 对 象 的 引用 计数 减少 的 方式 包括 使 用 del 语句 删除 一 个 变量 (参阅 下 一 节 )， 或 
者 当 一 个 对 象 被 移出 一 个 窗口 对 象 时 (或 该 容器 对 象 本 吴 的 引用 计数 变 成 了 0 时)。 总 结 一 下 ， 
一 个 对 象 的 引用 计数 在 以 下 情况 会 减少 : 

















e 一 个 本 地 引用 离开 了 其 作用 范围 。 比 如 foobar) (参见 上 一 下 例子 ) 函数 结束 时 。 
e 对 象 的 别名 被 显 式 的 销毁 。 

del y # or del x 

e 对 象 的 一 个 别名 被 赋值 给 其 它 的 对 象 

x - 123 

e 对 象 被 从 一 个 窗口 对 象 中 移 除 

myList. remove (x) 

e 窗口 对 象 本 身 被 销毁 


del myList 8 or goes out-of-scope 


dim 
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参阅 11.8 了 解 更 多 变量 作用 范围 的 信息 。 
del 语句 


Del 语句 会 删除 对 象 的 一 个 引用 ， 它 的 语法 是 : 
del objl[, obj2[,... objN]] 
例如 ， 在 上 例 中 执行 del y 会 产生 两 个 结果 : 


e 从 现在 的 名 字 空 间 中 删除 y 
e x 的 引用 计数 减 一 


引申 一 步 ， 执行 del x 会 删除 该 对 象 的 最 后 一 个 引用 ， 也 就 是 该 对 象 的 引用 计数 会 减 为 
0, 这 会 导致 该 对 象 从 此 “无 法 访问 ”或 “无 法 抵达 ”。 从 此 刻 起 ， 该 对 象 就 成 为 垃圾 回收 
机 制 的 回收 对 象 。 注意 任何 追踪 或 调试 程序 会 给 一 个 对 象 增加 一 个 额外 的 引用 ， 这 会 推迟 该 


对 象 被 回收 的 时 间 。 
$ 3.5.5 垃圾 收集 E: 


不 再 被 使 用 的 内 存 会 被 一 种 称 为 垃圾 收集 的 机 制 释放 。 象 上 面 说 的 ， 虽然 解释 器 跟踪 对 象 
的 引用 计数 ， 但 垃圾 收集 器 负责 释放 内 存 。 垃 圾 收集 器 是 一 块 独立 代码 ， 它 用 来 寻找 引用 计 
数 为 0 的 对 象 。 它 也 负责 检查 那些 虽然 引用 计数 大 于 0 但 也 应 该 被 销毁 的 对 象 。 特定 情形 会 导 
致 循环 引用 。 

















一 个 循环 引用 发 生 在 当 你 有 至 少 两 个 对 象 互 相 引 用 时 ， 也 就 是 说 所 有 的 引用 都 消失 时 ， 这 
些 引用 仍然 存在 ， 这 说 明 只 靠 引用 计数 是 不 够 的 。Python 的 垃圾 收集 器 实际 上 是 一 个 引用 计 
数 费 和 一 个 循环 垃圾 收集 器 。 当 一 个 对 象 的 引用 计数 变 为 0， 解 释 器 会 暂停 ， 释 放 掉 这 个 对 象 
和 仅 有 这 个 对 象 可 访问 〈 可 到 达 ) 的 其 它 对 象 。 作 为 引用 计数 的 补充 ， 垃圾 收集 器 也 会 留心 被 
分 配 的 总 量 很 大 (及 未 通过 引用 计数 销毁 的 那些 ) 的 对 象 。 在 这 种 情况 下 ， 解释 器 会 暂停 下 
来 ， 试图 清理 所 有 未 引用 的 循环 。 


3.6 第 一 个 Python 程序 


























dim 
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我 们 已 经 熟悉 了 语法 、 代 码 风 格 、 变 量 赋值 及 内 存 分 配 ， 现 在 来 看 一 点 略微 复杂 的 代码 。 
这 个 例子 中 还 有 你 不 熟悉 《我 们 还 未 讲 到 的 ) 的 Python 结构 ， 不 过 我 们 相信 因为 Python 非常 
的 简单 和 优雅 ， 你 一 定 可 以 弄 懂 每 一 行 代码 的 用 途 。 

















我 们 将 要 介绍 两 段 处 理 文本 文件 的 相关 脚本 。 首 先 ， makeTextFile. py, 创建 一 个 文本 文 
fr. 它 提 示 用 户 输入 每 一 行文 本 ， 然后 将 结果 写 到 文件 中 。 另 一 个 readTextFile.py 读 取 并 
显示 该 文本 文件 的 内 容 。 研究 一 下 这 两 段 代 码 ， 看 看 他 们 是 如 何 工 作 的 。 








例 3.1 创建 文件 (makeTextFile. py) 


这 个 脚本 提醒 用 户 输 入 一 个 ( 尚 不 存在 的 ) 文件 名 ， 然后 由 用 户 输入 该 文件 的 每 一 行 。 最 
将 所 有 文本 写 入 文本 文件 。 





m 





7 #//usr/bin/env python 
2 
3’ makeTextFile. py 一 create text file’ 
4 
Simport os 
6 Is = os. linesep 
7 
CN get filename 
9 while True: 
10 
11 if os. path. exists (fname) : 
12 print “ERROR: ° %s? already exists” % fname 
18 else: 
14 break 
15 
16 # get file content (text) lines 
17 all = [] 
18 print “\nEnter lines ČC.’ by itself to quit). |n 
19 
20 # loop until user terminates input 
21 while True: 
22 entry = raw input (> °) 
23 if entry == '.': 
24 break 
25 else: 


^ 
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26 all. append (entry) 

27 

28 # write lines to file with proper line-ending 
29 fobj = open(fname, °w’) 

30 fobj. writelines([’%s%s’ % (x, Is) for x in allj) 
31 fobj. close () 

32 print ° DONE!’ 


第 1-3 行 

UNIX 启动 行 之 后 是 模块 的 文档 字符 串 。 应 该 坚持 写 简 洁 并 有 用 的 文档 字符 串 。 这 里 我 们 写 
的 有 点 短 ， 不 过 对 这 段 代码 已 经 够 用 。 (建议 读者 看 一 下 标准 库 中 cgi 模块 的 文档 字符 串 ， 那 
是 一 个 很 好 的 示例 ) 




















第 5-6 行 
之 后 我 们 导入 os 模块 ， 在 第 6 行 我 们 为 os.linesep 属性 取 了 一 个 新 别名 。 这 样 做 一 方 
面 可 以 缩短 变量 名 ， 另 一 方面 也 能 改善 访问 该 变量 的 性 能 。 











核心 技巧 ， 使 用 局 部 变量 替换 模块 变量 k 
类 似 os. Linesep 这 样 的 名 字 需 要 解释 器 做 两 次 查询 : (1) 查 找 os 以 确认 它 是 一 个 模块 ， 

(2) 在 这 个 模块 中 查找 linesep 变量 。 因为 模块 也 是 全 局 变量 ， 我 们 多 消耗 了 系统 资源 。 如 

果 你 在 一 个 函数 中 类 似 这 样 频繁 使 用 一 个 属性 , 我 们 建议 你 为 该 属性 取 一 个 本 地 变量 别名 。 变 

量 查找 速度 将 会 快 很 多 一 一 在 查找 全 局 变量 之 前 ， 总 是 先 查找 本 地 变量 。 这 也 是 一 个 让 你 的 

程序 跑 的 更 快 的 技巧 : 将 经 常用 到 的 模块 属性 替换 为 一 个 本 地 引用 。 代 码 跑 得 更 快 ， 而 也 不 用 

老 是 敲 那么 长 的 变量 名 了 。 在 我 们 的 代码 片段 中 ， 并 没有 定义 函数 ， 所 以 不 能 给 你 定义 本 地 别 

名 的 示例 。 不 过 我 们 有 一 个 全 局 别名 ， 至 少 也 减少 了 一 次 名 字 查 询 

















第 8-14 行 
显然 这 是 一 个 无 限 循环 ， 也 就 是 说 除非 我 们 在 while 语句 体 提 供 break 语句 ， AMES 
一 直 循 环 下 去 。 


while 语句 根据 后 面 的 表达 式 决 定 是 否 进行 下 一 次 循环 ， 而 True 则 确保 它 一 直 循 环 下 去 。 
第 10 一 14 行 提示 用 户 输入 一 个 未 使 用 的 文件 名 。 raw_input () 内 建 函 数 接受 一 个 “提示 
字符 串 ” 参 数 ， 作 为 对 用 户 的 提示 信息 。raw_input 0 返回 用 户 输 入 的 字符 串 ， 也 就 是 为 fname 
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赋值 。 如 果 用 户 不 小 心 输入 了 一 个 已 经 存在 的 文件 的 名 字 ， 我 们 要 提示 这 个 用 户 重新 输入 另 一 
个 名 字 。 os. path. exists) 是 os 模块 中 一 个 有 用 的 函数 ， 帮助 我 们 确认 这 一 点 。 当 有 和 输 
入 一 个 不 存在 的 文件 名 时 ， os. path. exists) 才 会 返回 False， 这 时 我 们 中 断 循环 继续 下 面 
的 代码 。 

















第 16-26 1T 

这 部 分 代码 提供 用 户 指令 ， 引 导 用 户 输入 文件 内 容 ， 一 次 一 行 。 我 们 在 第 十 七 行 初始 化 了 
列表 all, 它 用 来 保存 每 一 行文 本 。 第 21 行 开 始 另 一 个 无 限 循环 ， 提示 用 户 输 入 每 一 行文 本 ， 
一 行 仅 输入 一 个 句点 “. ”表示 输入 结束 。 23 一 26 行 的 if-else 语句 判断 是 否 满足 结束 条 件 
以 中 止 循环 C47 24) , 否则 就 再 添加 新 的 一 行 。 

















第 28-32 行 

现在 所 有 内 容 都 保存 在 内 存 当 中 ， 我 们 需要 将 它们 保存 到 文件 。 第 29 行 打开 文件 准备 进 
行 写 操作 ， 第 30 行将 内 存 中 的 内 容 逐 行 写 入 文件 。 每 个 文件 都 需要 一 个 行 结束 符 ( 或 文件 结 
FIF) 。 第 30 行 的 结构 称 为 列表 解析 ， 它 做 以 下 事 : ”对 我 们 文件 的 每 一 行 ， 根据 程序 运行 
z 平台 添加 一 个 合适 的 行 结束 符 。“%s%s” 为 每 一 行 添 加 行 结束 符 ，(x，1s) 表 示 每 一 行 及 其 行 E 









































结束 符 ， 对 Unix 平 台 , ez \n’, XP DOS 或 win32 F8, We ' \r\n’ 。 通 过 使 用 os. lineseq , 
我 们 不 必 关 心 程 序 运行 在 什么 平台 ， 也 不 必要 根据 不 同 的 平台 诀 定 使 用 哪 种 行 结束 符 。 文件 
对 象 的 writelines () 方法 接收 包含 行 结 束 符 的 结果 列表 ， 并 将 它 写 入 文件 





























不 错 吧 。 现在 来 看 一 下 如 何 查 看 刚刚 创建 的 文件 ,。 出 于 这 个 目的 , 我 们 创建 了 第 二 个 Python 
脚本 ， readTextFile. py。 你 会 看 到 ， 它 比 makeTextFile. py 短 的 多 。 创 建 一 个 文件 的 复杂 度 
总 是 比 读 取 它 要 大 。 你 可 能 感 兴趣 的 、 有 新 意 的 一 点 在 于 异常 处 理 的 出 现 。 



































第 1-3 FF 
和 前 面 一 样 ， 是 Unix 启动 行 及 模块 文档 字符 串 。 


第 5-7 行 
不 同 于 makeTextFil. py, 我 们 在 这 个 例子 中 不 再 关心 用 户 是 否 输入 合适 的 文件 名 。 


Example 3.2 File Read and Display (readTextFile. py) 


dim 
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1 #!l/usr/bin/env Python 

2 

3 'readTextFile.py — read and display text file’ 
4 

3 # get filename 

6 fname = raw input( Enter filename: ') 
i print 

8 

9 # attempt to open file for reading 
I0 try: 

77 fobj = open(fname, 'r') 

12 except IOError, e: 

13 print ^*** file open error:”, e 

14 else: 

15 # display contents to the screen 

16 for eachLine in fobj: 

17 print eachLine, 

18 fob j. close 








换 名 话说， 我 们 在 其 它 地 方 进行 验证 工作 《如果 需要 ) . 58 7 行 打印 一 个 空 行 以 便 将 提 
示 信 息 和 文件 内 容 分 隔 开 来 。 








第 9-18 行 

脚本 的 剩余 部 分 展示 了 一 种 新 的 Python 结构 ， try-except-else 语句 。try 子 句 是 一 段 
我 们 希望 监测 错误 的 代码 块 。 在 第 10—11 行 代码 ， 我 们 尝试 打开 用 户 输入 的 文件 。except T 
句 是 我 们 处 理 错误 的 地 方 。 在 12—13 行 ， 我 们 检查 open) 是 否 失 败 一 通常 是 IOError 类 型 
的 错误 。 














最 后 ，14 一 18 行 的 else FATE try 代码 块 运行 无 误 时 执行 。 我 们 在 这 儿 将 文件 的 每 一 行 
显示 在 屏幕 上 。 注 意 由 于 我 们 没有 移 除 代表 每 行 结 束 的 行 结束 符 ， 我 们 不 得 不 抵制 print 语句 
自动 生成 的 行 结束 符 一 一 通过 在 print 语句 的 最 后 加 一 个 逗号 可 以 达到 这 一 目的 。 第 18 行 关 
闭 文件 ， 从 而 结束 这 段 脚本 。 

最 后 要 讲 的 一 点 是 关于 使 用 os. path. exists () 和 异常 处 理 : 一 般 程序 员 倾 向 于 使 用 前 者 ， 
因为 有 一 个 现成 的 函数 可 以 检查 错误 条 件 一 一 并 且 很 简单 ， 这 是 个 布尔 函数 ， 它 会 告 你 “是 ” 
还 是 “不 是 ”。 “注意 ， 这 个 函数 内 可 能 已 经 有 异常 处 理 代 码 ) 。 那 你 为 什么 还 要 重新 发 明 一 
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个 轮子 来 干 同样 一 件 事 ? 异常 处 理 最 适用 的 场合 ， 是 在 没有 合适 的 函数 处 理 异 常 状 况 的 时 候 。 

这 时 程序 员 必 须 识别 这 些 非 正常 的 错误 ， 并 做 出 相应 处 理 。 对 我 们 的 例子 来 说 ， 我 们 能 够 通过 
检查 文件 是 否 存 在 来 避免 异常 发 生 ， 不 过 因为 有 可 能 因为 其 它 原因 造成 文件 打开 失败 ， 比 如 缺 
少 权 限 ， 网 络 驱 动 器 突然 连接 失败 等 等 。 从 更 安全 的 角度 来 说 ， 就 不 应 该 使 用 类 似 
os.path.exists 之 类 类 的 函数 而 是 使 用 异常 处 理 ， 尤其 是 在 没有 合适 函数 的 情况 下 更 应 如 此 。 



























































你 会 在 第 9 章 中 找到 更 多 文件 系统 函数 的 例子 ， 在 第 10 章 则 有 更 多 关于 异常 处 理 的 知识 。 


3.6 相关 模块 和 开发 工具 


Python 代码 风格 指南 (PEP8) , Python 快速 参考 和 Python 常见 问答 都 是 开发 者 很 重要 的 
“TA” . AIh 还 有 一 些 模块 会 帮助 你 成 为 一 个 优秀 的 Python 程序 员 。 
€ Debugger: pdb 








€ Logger: logging 
€ Profilers: profile, hotshot, cProfile 


$ 调试 模块 pdb 允许 你 设置 (条件 ) 断 点 ,代码 逐 行 执 行 , 检查 堆栈 。 它 还 支持 事后 调试 。 E: 





logging 模块 是 在 Python2. 它 定义 了 一 Relig 帮助 你 的 程序 实现 灵活 
的 日 志 系统 。 共 有 五 级 日 志 级 别 : Ae, 错误 ， 和 警告 ， 信 息 和 调试 。 

















历史 上 ， 因 为 不 同 的 人 们 为 了 满足 不 同 的 需求 重复 实现 了 很 多 性 能 测试 器 ，Python 也 有 好 
几 个 性 能 测试 模块 。 最 早 的 Python profile 模块 是 Python 写成 的 ， 用 来 测试 函数 的 执行 时 
间 ， 及 每 次 脚本 执行 的 总 时 间 ， 既 没有 特定 函数 的 执行 时 间 也 没有 被 包含 的 子 函 数 调用 时 间 。 
在 三 个 profile 模块 中 ， 它 是 最 老 的 也 是 最 慢 的 ， 尽 管 如 此 ， 它 仍然 可 以 提供 一 些 有 价值 的 性 
能 信息 。 hotshot 模块 是 在 Python2. 2 中 新 增 的 ， 它 的 目标 是 取代 profile HR, 它 修复 了 
profile 模块 的 一 些 错误 ， 因为 它 是 用 C 语言 写成 , 所 以 它 有 效 的 提高 了 性 能 。 注意 hotshot 
重点 解决 了 性 能 测试 过 载 的 问题 ， 但 却 需要 更 多 的 时 间 来 生成 结果 。Python2.5 版 修复 了 
hotshot 模块 的 一 个 关于 时 间 计 量 的 严重 bug。 









































cProfile 模块 是 Python2. 5 新 增 的 ， 它 用 来 替换 掉 已 经 有 历史 的 hotshot 和 profile 模 
块 。 被 作者 确认 的 它 的 一 个 较 明 显 的 缺点 是 它 需 要 花 较 长 时 间 从 日 志文 件 中 载 入 分 析 结 果 ， 不 
支持 子 函 数 状 态 细节 及 某 些 结果 不 准 。 它 也 是 用 C 语言 来 实现 的 。 
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3.8 AY 


3-1. 标识 符 。 为 什么 Python 中 不 需要 变量 名 和 变量 类 型 声明 ? 

3-2. RRF. JAFA Python 中 不 需要 声明 函数 类 型 ? 

3-3. ”标识 符 。 为 什么 应 当 避 免 在 变量 名 的 开始 和 和 结尾 使 用 双 下 划 线 ? 
3-4 

3-5 














语句 。 在 Python 中 一 行 可 以 书写 多 个 语句 吗 ? 
语句 。 在 Python 中 可 以 将 一 个 语句 分 成 多 行书 写 吗 ? 

3-6. ”变量 赋值 

(a) 赋值 语句 x，y，z = 1, 2, 3 会 在 x. y. z 中 分 别 赋 什么 值 ? 

(b) PUT z, x y=y, z x x. y. z 中 分 别 含 有 什么 值 ? 

3-7. 标识 符 。 下 面 哪些 是 Python 合法 的 标识 符 ? 如 果 不 是 ， 请 说 明理 由 ! 在 合法 的 标 
识 符 中 ， 哪 些 是 关键 字 ? 








int32 AOXL Saving$ printf print 
print this self . name -. Ox40L 
bool true big-daddy 2hot2touch type 
thisIsn'tAVar thisIsAVar R U Ready Int True 
LE do counter-1 access 


下 面 的 问题 涉及 了 makeTextFile.py fl readTextFile. py 脚本 。 


3-8. Python 代码 。 将 脚本 拷贝 到 您 的 文件 系统 中 ， 然 后 修改 它 。 可 以 添加 注释 ， 修 改 
提示 符 〈 “>” 太 单调 了 ) 等 等 ， 修 改 这 些 代码 ， 使 它 看 上 去 更 舒服 。 

3-9. 移植 。 如 果 你 在 不 同类 型 的 计算 机 系统 中 分 别 安装 有 Python, 检查 一 下 ， 
os. linesep 的 值 是 否 有 不 同 。 记 下 操作 系统 的 类 型 以 及 linesep 的 值 。 

3-10. 异常。 使 用 类 似 readTextFile.py 中 异常 处 理 的 方法 取代 readTextFile. py 
makeTextFile.py 中 对 os.path.exists( 的 调用 。 反 过 来 ， 用 os.path.exists() 取代 
readTextFile. py 中 的 异常 处 理 方法 。 

3 - 11. 

字符 串 格 式 化 不 再 抑制 readTextFile.py 中 print 语句 生成 的 NEWLINE 字符 , 修改 你 的 
代码 ， 在 显示 一 行 之 前 删除 每 行 末尾 的 空白 。 这 样 ， 你 就 可 以 移 除 print 语句 末尾 的 逗号 了 。 
fern: ”使 用 字符 串 对 象 的 strip (方法 
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dim 
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3= 1 合并 源 文 件 。 将 两 段 程序 合并 成 一 个 ， 给 它 起 一 个 你 喜欢 的 名 字 ， 比 方 
readNwriteTextFiles. py。 让 用 户 自己 选择 是 创建 还 是 显示 一 个 文本 文件 。 
readNwriteTextFiles. py 增加 一 个 新 功 
fe: 允许 用 户 编辑 一 个 已 经 存在 的 文本 文件 。 你 可 以 使 用 任何 方式 ， 无论 是 一 次 编辑 一 行 ， 还 





3- 13. ”添加 新 功能 。 将 你 上 一 个 问题 改造 好 的 


























是 一 次 编辑 所 有 文本 。 需 要 提醒 一 下 的 是 ， 一 次 编辑 全 部 文本 有 一 定 难 度 , 你 可 能 需要 借助 GUI 
工具 包 或 一 个 基于 屏幕 文本 编辑 的 模块 比如 curses 模块 。 要 允许 用 户 保存 他 的 修改 (保存 到 









































文件 ) 或 取消 他 的 修改 〈 不 改变 原始 文件 ) ， 并 且 要 看 
常 关闭 ) 。 
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有 保 原始 文件 的 安全 性 (不 论 程序 是 否 正 








* 
e 


Edit By Vheavens 





~ Python 对 象 
A I" J. 


本 章 主题 
Python 对 象 
内 建 类 型 
标准 类 型 运算 符 
值 的 比较 
对 象 身份 比较 
布尔 类 型 
标准 类 型 内 建 函 数 
标准 类 型 总 览 
各 种 类 型 
不 支持 的 类 型 
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Chapter 


我 们 现在 来 学 习 Python 语言 的 核心 部 分 。 首 先 我 们 来 了 解 什 么 是 Python 对 象 ， 然 后 讨论 
最 常用 的 内 建 类 型 ， 接 下 来 我 们 讨论 标准 类 型 运算 符 和 内 建 函数 ,之 后 给 出 对 标准 类 型 的 不 同 








分 类 方式 。 这 有 助 于 我 们 更 好 的 理 











LE 解 他 们 如 何 工 作 。 最 后 我 们 提 一 提 Python 目前 还 不 支持 的 


类 型 〈 这 对 那些 有 其 他 高 级 语言 经 验 的 人 会 有 所 帮助 )。 





44 Python 对 象 





Python 使 用 对 象 模型 来 存储 数据 。 构 造 任何 类 型 的 值 都 是 一 个 对 象 。 尽 管 Python 通常 当 


成 一 种 “面向 对 象 的 编程 语言 ”， 
Python 的 对 象 语法 和 架构 鼓励 我 们 











但 你 完全 能 够 写 出 不 使 用 任何 类 和 实例 的 实用 脚本 。 不 过 
使 用 这 些 特性 ， 下 面 让 我 们 仔细 研究 一 下 Python 对 象 。 


所 有 的 Python 对 像 都 拥有 三 个 特性 ， 身份 ， 类 型 和 值 。 





Hj 











每 一 个 对 象 都 有 一 个 唯一 的 身份 标识 自己 ,任何 对 象 的 身份 可 以 使 用 内 建 函 数 id() 来 得 到 。 
这 个 值 可 以 被 认为 是 该 对 象 的 内 存 地 址 。 您 极 少 会 用 到 这 个 值 ， 也 不 用 太 关 心 它 究竟 是 什么 。 


类 型 


对 象 的 类 型 决定 了 该 对 象 可 以 保存 什么 类 型 的 值 ， 可 以 进行 什么 样 的 操作 ， 以 及 遵循 什么 
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ET 








样 的 规则 。 您 可 以 用 内 建 函 数 type O 查看 Python 对 象 的 类 型 。 因 为 在 Python 中 类 型 也 是 对 象 
(还 记得 我 们 提 到 Python 是 面向 对 象 的 这 句 话 吗 ?)， 所 以 type 0 返回 的 是 对 象 而 不 是 简单 的 
字符 串 。 

值 

对 象 表示 的 数据 项 


上 面 三 个 特性 在 对 象 创建 的 时 候 就 被 赋值 ， 除 了 值 之 外 ， 其 它 两 个 特性 都 是 只 读 的 。 对 于 
新 风格 的 类 型 和 类 ， 对 象 的 类 型 也 是 可 以 改变 的 ， 不 过 对 于 初学 者 并 不 推荐 这 样 做 。 





如 果 对 象 支持 更 新 操作 ， 那 么 它 的 值 就 可 以 改变 ， 否 则 它 的 值 也 是 只 读 的 。 对 象 的 值 是 否 
可 以 更 改 被 称 为 对 象 的 可 改变 性 (mutability)， 我 们 会 在 后 面 的 小 节 4.7 中 讨论 这 个 问题 。 只 
要 一 个 对 象 还 没有 被 销毁 ， 这 些 特 性 就 一 直 存 在 。 














Python 有 一 系列 的 基本 《内 建 ) 数据 类 型 ， 必 要 时 也 可 以 创建 自 定 义 类 型 来 满足 你 的 应 用 
程序 的 需求 。 绝 大 多 数 应 用 程序 通常 使 用 标准 类 型 ， 对 特定 的 数据 存储 则 通过 创建 和 实例 化 类 


来 实现 。 
人 4.1.1 ”对象 属性 + 


某 些 Python 对 象 有 属性 、 值 或 相关 联 的 可 执行 代码 , 比如 方法 (method). Python 用 点 C ) 
标记 法 来 访问 属性 。 属 性 包括 相应 对 象 的 名 字 等 等 ， 在 章节 2. 14 的 备注 中 曾 做 过 介绍 。 最 党 
的 属性 是 函数 和 方法 ， 不 过 有 一 些 Python 类 型 也 有 数据 属性 。 含 有 数据 属性 的 对 象 包括 〈 但 不 
限于 )， 类 、 类 实例 、 模 块 、 复 数 和 文件 。 


4.2 标准 类 型 


数字 (分 为 几 个 子 类 型 ， 其 中 有 三 个 是 整 型 ) 
整 型 
布尔 型 
长 整 型 
浮 点 型 
复数 型 
字符 串 

































































dim 
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列表 
e 元 组 
e 字典 


在 本 书 中 ， 我 们 把 标准 类 型 也 称 作 “基本 数据 类 型 >” 因为 这 些 类 型 是 Python 内 建 的 基本 
数据 类 型 ， 我 们 会 在 第 5、6 和 7 章 详 细 介绍 它们 。 


4.3 其 他 内 建 类 型 
类 型 

Null 对 象 (None) 

文件 

集合 /固定 集合 

函数 /方法 
模块 

类 


这 些 是 当 你 做 Python 开发 时 可 能 会 用 到 的 一 些 数 据 类 型 。 我 们 在 这 里 讨论 Type 和 None 














类 型 的 使 用 ， 除 此 之 外 的 其 他 类 型 将 在 其 他 章节 中 讨论 。 
4.3.1 ”类 型 对 象 和 type 类 型 对 象 


在 本 章 我 们 要 讨论 所 有 的 Python RA, 虽然 看 上 去 把 类 型 本 映 也 当成 对 象 有 点 特别 , 我 们 
还 是 要 在 这 里 提 一 提 。 你 一 定 还 记得 ， 对 象 的 一 系列 固有 行为 和 特性 (比如 支持 哪些 运算 ， 具 
有 哪些 方法 ) 必须 事先 定义 好 。 从 这 个 角度 看 ， 类 型 正 是 保存 这 些 信 息 的 最 佳 位 置 。 描 述 一 种 
类 型 所 需要 的 信息 不 可 能 用 一 个 字符 串 来 搞定 ， 所 以 类 型 不 能 是 一 个 简单 的 字符 串 ， 这 些 信息 
不 能 也 不 应 该 和 数据 保存 在 一 起 ， 所 以 我 们 将 类 型 定义 成 对 象 。 



























































下 面 我 们 来 正式 介绍 内 建 函 数 type O 。 通 过 调用 type O 函数 你 能 够 得 到 特定 对 象 的 类 型 
信息 : 


Aste 


225 type (42) 
«type “int’> 


我 们 仔细 研究 一 下 这 个 例子 ， 请 注意 看 type 函数 有 趣 的 返回 值 。 我 们 得 到 一 个 简洁 的 
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输出 结果 <type int >。 不 过 你 应 当 意 识 到 它 并 不 是 一 个 简 简 单单 的 告诉 你 42 是 个 整数 这 样 
的 字符 串 。 您 看 到 的 type “int > 实际 上 是 一 个 类 型 对 象 ， 碰 巧 它 输出 了 一 个 字符 串 来 告诉 你 
它 是 个 int 型 对 象 。 





现在 你 该 问 自己 了 ， 那 么 类 型 对 象 的 类 型 是 什么 ? OR. 我 们 试验 一 下 : 


22^ type (type (42)) 
«type 'type'^ 


没 错 ， 所 有 类 型 对 象 的 类 型 都 是 type， 它 也 是 所 有 Python 类 型 的 根 和 所 有 Python 标准 类 
的 默认 元 类 (metaclass)。 你 现在 有 点 搞 不 明白 , 没关系 , 随 着 我 们 逐步 深入 的 学 习 类 和 类 型 ， 


你 就 会 慢 慢 理解 。 
































随 着 Python 2.2 中 类 型 和 类 的 统一 ， 类 型 对 象 在 面向 对 象 编 程 和 日 常 对 象 使 用 中 扮演 着 
更 加 重要 的 角色 。 从 现在 起 ， 类 就 是 类 型 ， 实 例 是 对 应 类 型 的 对 象 。 


$ 4.3.2 None, Python 的 Null 对 象 


Python 有 一 个 特殊 的 类 型 ,被 称 作 Null 对 象 或 者 NoneType, 它 只 有 一 个 值 , 那 就 是 None. 
它 不 文 持 任何 运算 也 没有 任何 内 建 方法 。 如 果 非 常熟 悉 C 语言 ， 和 None 类 型 最 接近 的 c 类 型 就 
是 void, None 类 型 的 值 和 C AY NULL 值 非常 相似 (其 他 类 似 的 对 象 和 值 包括 Perl 的 undef 和 
Java 的 void 类 型 与 null 值 )。 
































None 没有 什么 有 用 的 属性 ， 它 的 布尔 值 总 是 False。 











核心 笔记 : 布尔 值 

所 有 标准 对 象 均 可 用 于 布尔 测试 ， 同 类 型 的 对 象 之 间 可 以 比较 大 小 。 每 个 对 象 天 生 具 有 布 
^K True 或 False 值 。 空 对 象 、 值 为 零 的 任何 数字 或 者 Nul11 对 象 None 的 布尔 值 都 是 False。 

下 列 对 象 的 布尔 值 是 False。 

€ None 

€ False (布尔 类 型 ) 

e 所 有 的 值 为 零 的 数 : 





+ > - 
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0 (QE) 
( 浮 点 型 ) 
OL (长 整 型 ) 
0. 0+0. 0j (复数 ) 
“” ( 空 字符 串 ) 
[] ( 空 列表 ) 
O ( 空 元 组 ) 
e ( ( 空 字典 ) 
值 不 是 上 面 列 出 来 的 任何 值 的 对 象 的 布尔 值 都 是 True, 例如 non-empty, non-zero 等 等 。 
用 户 创建 的 类 实例 如 果 定 义 了 nonzero(_nonzero_()) BR length ( len 0) 且 值 为 0， 那 
么 它们 的 布尔 值 就 是 False。 


4.4 内 部 类 型 
e 代码 
© W 
$ e 跟踪 记录 + 
e UJ 
e «Alix 
€ Xrange 











我 们 在 这 里 简要 介绍 一 下 这 些 内 部 类 型 ， 一 般 的 程序 员 通 常 不 会 直接 和 这 些 对 象 打交道 。 
不 过 为 了 这 一 章 的 完整 性 , 我 们 还 是 在 这 里 介绍 一 下 它们 。 请 参阅 源 代码 或 者 Python 的 内 部 文 
档 和 在 线 文档 获得 更 详尽 的 信息 。 

你 如 果 对 异常 感到 迷惑 的 话 ， 可 以 告诉 你 它们 是 用 类 来 实现 的 ， 在 老 版 本 的 Python 中 ， 异 
常 是 用 字符 串 来 实现 的 。 


4.4.1 代码 对 象 
代码 对 象 是 编译 过 的 Python 源 代 码 片段 ， 它 是 可 执行 对 象 。 通 过 调用 内 建 函 数 compi 1e O 


可 以 得 到 代码 对 象 。 代 码 对 象 可 以 被 exec 命令 或 evalO 内 建 函 数 来 执行 。 在 第 14 章 将 详细 
研究 代码 对 象 。 
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代码 对 象 本 身 不 包含 任何 执行 环境 信息 ， 它 是 用 户 自 定义 函数 的 核心 ， 在 被 执行 时 动态 
获得 上 下 文 。( 事 实 上 代码 对 象 是 函数 的 一 个 属性 ) 一 个 函数 除了 有 代码 对 象 属性 以 外 ， 还 有 一 
些 其 它 函 数 必须 的 属性 ， 包 括 函 数 名 ， 文 档 字 符 串 ， 默 认 参 数 ， 及 全 局 命名 空间 等 等 。 


4.4.2 WHR 

帧 对 象 表 示 Python 的 执行 栈 帧 。 帧 对 象 包 含 Python 解释 器 在 运行 时 所 需要 知道 的 所 有 信 
息 。 它 的 属性 包括 指向 上 一 帧 的 链接 ， 正 在 被 执行 的 代码 对 象 ( 参 见 上 文 ;， 本 地 及 全 局 名 字 空 
间 字 典 以 及 当前 指令 等 。 每 次 函数 调用 产生 一 个 新 的 帧 ， 每 一 个 帧 对 象 都 会 相应 创建 一 个 C 栈 
帧 。 用 到 帧 对 象 的 一 个 地 方 是 跟踪 记录 对 象 〈 参 见 下 一 节 ) 


4.4.3 跟踪 记录 对 象 
当 你 的 代码 出 错时 ， Python 就 会 引发 一 个 异常 。 如 果 异 常 未 被 捕获 和 处 理 ， 解释 器 就 会 
退出 脚本 运行 ， 显 示 类 似 下 面 的 诊断 信息 : 


Traceback (innermost last): 

File stdin”, line N?, in ??? 

ErrorName: error reason 

当 异 党 发 生 时 ， 一 个 包含 针对 异常 的 栈 跟 踪 信 息 的 跟踪 记录 对 象 被 创建 。 如 果 一 个 异 * 
自己 的 处 理 程序 ， 处 理 程序 就 可 以 访问 这 个 跟踪 记录 对 象 。 


4.4.4 切片 对 象 
当 使 用 Python 扩展 的 切片 语法 时 ， 就 会 创建 切片 对 象 。 扩 展 的 切片 语法 允许 对 不 同 的 索引 
切片 操作 , 包括 步 进 切片 ， 多 维 切 片 ， 及 省 略 切片 。 多 维 切片 语法 是 sequencelstartl : endl, 
start2 : end2], 或 使 用 省 略 号 ， sequence[...,startl : endl ]. 切片 对 象 也 可 以 由 内 建 
函数 slice(O 来 生成 。 步 进 切 片 允 许 利 用 第 三 个 切片 元 素 进 行 步 进 切 片 ， 它 的 语法 为 
sequence[ 起 始 索 引 : 结束 索引 : 步 进 值 ] Python 很 早 就 支持 扩展 步 进 切 片 语法 了 , 但 直到 
Python2. 3 以 前 都 必须 依靠 C API 或 Jython 才能 工作 。 下 面 是 儿 个 步 进 切 片 的 例子 : 
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a 












































2> foostr = 'abcde' 
2» foostr[::-1] 
"edcba' 

2» foostr[::-2] 
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'eca' 

2» foolist = [123, 'xba', 842.23, 'abc'] 
>> foolistí::-1] 

[ abc’, 342 23, 'xba', 123] 


4.4.5 省 略 对 象 
省 略 对 象 用 于 扩展 切片 语法 中 ， 起 记号 作用 。 这 个 对 象 在 切片 语法 中 表示 省 略 号 。 类 似 
Null 对 象 None， 省 略 对 象 有 一 个 唯一 的 名 字 Ellipsis， 它 的 布尔 值 始 终 为 True. 











4.4.6 XRange 对 象 

调用 内 建 函 数 xrangeO 会 生成 一 个 Xrange WR, xrange () 是 内 建 函 数 range O 的 兄弟 版 
A. 用 于 需要 节省 内 存 使 用 或 range (无 法 完成 的 超大 数据 集 场合 。 在 第 8 章 你 可 以 找到 更 多 
关于 range) 和 xrangeO 的 使 用 信息 。 


4.5 标准 类 型 运算 符 


$ 4.5.1 对 象 值 的 比较 E: 


比较 运算 符 用 来 判断 同类 型 对 象 是 否 相等 ， 所 有 的 内 建 类 型 均 支 持 比 较 运算 ， 比 较 运算 返 
回 布尔 值 True 或 False。 如 果 你 正在 使 用 的 是 早 于 Python2. 3 的 版 本 ， 因 为 这 些 版 本 还 没有 
布尔 类 型 ， 所 以 会 看 到 比较 结果 为 整 型 值 1 RK True) 或 0 (代表 False)。 

注意 ， 实 际 进行 的 比较 运算 因 类 型 而 异 。 换 言 之 ， 数 字 类 型 根据 数值 的 大 小 和 符号 比较 ， 
字符 串 按 照 字符 序列 值 进行 比较 ， 等 等 。 



































52-22 

True 

25 2.46 = & 33 
True 

2205 5t4f >= 2-3j 
True 

2 abe’? == 'xyzg! 
False 

2 abe? > 'xyz! 
False 


dim 
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22 abe? < 'xyz! 


True 
2» [3, ?abe’] == ('abc', 3] 
False 
2 [3, 'abc' ] == [3, 'abc'] 
True 








不 同 于 很 多 其 它 语 言 ， 多 个 比较 操作 可 以 在 同一 行 上 进行 ， 求 值 顺 序 为 从 左 到 右 。 


> 3 <4<7 £Zsam as(3«4) and(4« 7) 


True 

D> 4>3==3 # same as (453) and (3-73) 
True 

DDO 4ASBSE!IF 267 

False 


我 们 会 注意 到 比较 操作 是 针对 对 象 的 值 进行 的 , 也 就 是 说 比较 的 是 对 象 的 数值 而 不 是 对 象 


本 身 。 在 后 面 的 部 分 我 们 会 研究 对 象 身份 的 比较 。 
表 4.1 标准 类 型 值 比较 运算 符 


HTT XE 

exprl < expr2 | exprl 4^ expr2 

expri > expr2 expr! X expr2 

exprl <= expr? expri J FEF expr2 

exprl >= expr? expri A JY €T expr2 

exprl == expr? expri F expr2 

expri /= expr2 expri PFEF expr2 (C M) 

expri © expr? expri 4^ expr? (ABC/Pascal US) 





TE: 未 来 很 有 可 能 不 再 支持 《> 运算 符 ， 建 议 您 一 直 使 用 != 运算 符 。 


4.5.2 对 象 身份 比较 
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作为 对 值 比较 的 补充 ，Python 也 支持 对 象 本 身 的 比较 。 对 象 可 以 被 赋值 到 另 一 个 变量 ( 通 
过 引用 )。 因 为 每 个 变量 都 指向 同一 个 (共享 的 ) 数据 对 象 ， 只 要 任何 一 个 引用 发 生 改变 ， 该 对 
象 的 其 它 引 用 也 会 随 之 改变 。 




















为 了 方便 大 家 理解 ， 最 好 先 别 考虑 变量 的 值 ， 而 是 将 变量 名 看 作对 象 的 一 个 链接 。 让 我 们 
来 看 以 下 三 个 例子 : 








例 1: fool 和 foo2 指向 相同 的 对 象 
fool = foo2 = 4.3 


当 你 从 值 的 观点 看 这 条 语句 时 ， 它 表 现 的 只 是 一 个 多 重 赋值 ， 将 4. 3 这 个 值 赋 给 了 fool 
和 foo2 这 两 个 变量 。 这 当然 是 对 的 ， 不 过 它 还 有 另 一 层 含义 。 事实 是 一 个 值 为 4.3 的 数字 对 
象 被 创建 , 然后 这 个 对 象 的 引用 被 赋值 给 fool 和 foo2， 结 果 就 是 fool 和 foo2 指向 同一 个 对 
象 。 图 4 一 1 演示 了 一 个 对 象 两 个 引用 。 




















4.3 


fool n S 


» 
puses 
foo2— 


4-1 fool 和 foo2 指 向 相同 的 对 象 


例 2: fool 和 foo2 指向 相同 的 对 象 
fool = 4.38 
foo2 = fool 





这 个 例子 非常 类 似 上 一 个 ， 一 个 值 为 4. 3 的 数值 对 象 被 创建 ， 然 后 赋 给 一 个 变量 ， 当 执 行 
foo2 = fool 时 ， foo2 被 指向 fool 所 指向 的 同一 个 对 象 ， 这 是 因为 Python 通过 传递 引用 来 
处 理 对 象 。foo2 就 成 为 原始 值 4. 3 的 一 个 新 的 引用 。 这 样 fool 和 foo2 就 都 指向 了 同一 个 对 
象 。 示 意图 也 和 图 4 一 1 一 样 。 





例 3: fool 和 foo2 指向 不 同 的 对 象 
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fool = 4.38 
foo? = 1.3 + 3.0 








这 个 例子 有 所 不 同 。 首 先 一 个 数字 对 象 被 创建 ， 然 后 赋值 给 foo1， 然 后 第 二 个 数值 对 象 被 
创建 并 赋值 给 foo2， 尽 管 两 个 对 象 保 存 的 是 同样 大 小 的 值 ， 但 事实 上 系统 中 保存 的 都 是 两 个 独 
立 的 对 象 ， 其 中 fool 是 第 一 个 对 象 的 引用 ， foo2 则 是 第 二 个 对 象 的 引用 。 图 4 一 2 演示 给 我 
们 这 里 有 两 个 不 同 的 对 象 ， 尽管 这 两 个 对 象 有 同样 大 小 的 数值 。 我 们 为 什么 在 示意 图 中 使 用 盒 
T? 没 错 ， 对 象 就 象 一 个 装着 内 容 的 盒子 。 当 一 个 对 象 被 赋值 到 一 个 变量 ， 就 象 在 这 个 盒子 上 
贴 了 一 个 标签 ， 表 示 创 建 了 一 个 引用 。 每 当 这 个 对 象 有 了 一 个 新 的 引用 ， 就 会 在 盒子 上 新 贴 一 
张 标签 。 当 一 个 引用 被 销毁 时 ， 这 个 标签 就 会 被 撕 掉 。 当 所 有 的 标签 都 被 撕 掉 时 ， 这 个 盒 
就 会 被 回收 。 那 么 ，Python 是 怎么 知道 这 个 盒子 有 多 少 个 标签 呢 ? 























: 图 4-2 fool 和 foo2 指向 不 同 的 对 象 
每 个 对 象 都 天 生 具 有 一 个 计数 器 , 记录 它 自己 的 引用 次 数 。 这 个 数目 表示 有 多 少 个 变量 指 


向 该 对 象 。 这 也 就 是 我 们 在 第 三 章 3. 5. 5-3. 5.7 小 节 提 到 的 引用 计数 .Python 提供 了 is 和 is not 
运算 符 来 测试 两 个 变量 是 否 指向 同一 个 对 象 。 象 下 面 这 样 执行 一 个 测试 


a is b 
这 个 表达 式 等 价 于 下 面 的 表达 式 
id(a) == id(b) 


对 象 身 份 比较 运算 符 拥有 同样 的 优先 级 ， 表 4.2 列 出 了 这 些 运算 符 。 在 下 面 这 个 例子 里 ， 
我 们 创建 了 一 个 变量 ， 然 后 将 第 二 个 变量 指向 同一 个 对 象 。 











»^a-í^5 hat, -93] 
2> b=a 

>> ais b 

True 

22^ a is not b 

False 


e+ 
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222 

2> b = 2. 5e-8 
22b 

Z. 5e-005 

»»> a 

[5, hat’, -9.3] 
2»? a isb 
False 

22^ a is not b 
True 





is 5 not 标识 符 都 是 Python 关键 字 。 


表 4.2 标准 类 型 对 象 身份 比较 运算 符 


RTT Que 
objl is obj2 ob jl Fl ob j2 Xd [n] — df Xj Zi 
objl is not obj2 ob jl Fl ob j2 PÆ — fs XJ i 


核心 提示 : 实践 
在 上 面 的 例子 中 , 您 会 注意 到 我 们 使 用 的 是 浮 点 数 而 不 是 整数 。 为 什么 这 样 ? 整数 对 象 和 
字符 串 对 象 是 不 可 变 对 象 , 所 以 Python 会 很 高 效 的 缓存 它们 。 这 会 造成 我 们 认为 Python 应 该 
创建 新 对 象 时 ， 它 却 没有 创建 新 对 象 的 假象 。 看 下 面 的 例子 : 
Aja eJ 
M» id(a) 
8402824 
» b= 1 
2» Id(b) 
8402824 
p» 
»>c=1.0 
2 id(c) 
8651220 
» d= 1.0 
2» id(d) 
8651204 


在 上 面 的 例子 中 , a 和 b 指向 了 相同 的 整数 对 象 , 但 是 
对 象 。 如 果 我 们 是 纯粹 主义 者 ， 我 们 会 希望 a 与 b 能 和 c 
了 创建 两 个 整数 对 象 ， 而 不 是 像 b= a 这 样 的 结果 。 


E 


c 和 d 并 没有 指向 相同 的 浮 点 数 
与 d 一 样 ， 因 为 我 们 本 意 就 是 为 





+- > 
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e^ we 


Python 仅 缓 存 简单 整数 ， 因 为 它 认 为 在 Python 应 用 程序 中 这 些小 整数 会 经 常 被 用 到 。 当 
我 们 在 写作 本 书 的 时 候 ，Python 缓存 的 整数 范围 是 (-1，100) ， 不 过 这 个 范围 是 会 改变 的 ， 所 
以 请 不 要 在 你 的 应 用 程序 使 用 这 个 特性 。 

Python 2.3 中 决定 ， 在 预定 义 缓存 字符 串 表 之 外 的 字符 串 ， 如 果 不 再 有 任何 引用 指向 它 ， 
那 这 个 字符 串 将 不 会 被 缓存 。 也 就 是 说 ， 被 缓存 的 字符 串 将 不 会 象 以 前 那样 永生 不 灭 ， 对 象 回 
收 器 一 样 可 以 回收 不 再 被 使 用 的 字符 串 。 从 Python 1.5 起 提供 的 用 于 缓存 字符 的 内 建 函 数 
intern() 也 已 经 不 再 推荐 使 用 ， 即将 被 废弃 。 


4.5.3 布尔 类 型 
布尔 逻辑 运算 符 and, or 和 not 都 是 Python 关键 字 ， 这 些 运算 符 的 优先 级 按 从 高 到 低 


的 顺序 列 于 表 4.3. not 运算 符 拥 有 最 高 优先 级 ， 只 比 所 有 比较 运算 符 低 一 级 。 and 和 or 运 
算 符 则 相应 的 再 低 一 级 。 





























表 4.3 标准 类 型 布尔 运算 符 


EAM Hie 
not expr expr IE HAE (FF) 


expri and expr2 exprl HI expr? [fff 
expr] or expr2 exprl HI expr? HV K 


> x, y = 3. 1415926536, —1024 

D> x 6 0 

True 

2» not (x < 5.0) False 

2> (x < 50) or (y > 2. 718281828) True 
S»»> (x < 50) and (y > 2. 718281828) False 
222 not (x is y) 

True 


前 面 我 们 提 到 过 Python SCRE— P RIAL & hCG TE, — 其 实 这 个 表达 式 本 质 上 是 由 
多 个 隐 式 的 and 连接 起 来 的 多 个 表达 式 。 


E 

















> 36467 £Zsam as “(8 <4) and(4« 7)^ 
True 


oe 





t- > - 
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4. 6 标准 类 型 内 建 函 数 


除了 这 些 运算 符 ， 我 们 刚才 也 看 到 ，Python 提供 了 一 些 内 建 函 数 用 于 这 些 基 本 对 象 类 型 ; 
cmpO, repr(), str), type(0， 和 等 同 于 repr() 函 数 的 单反 引号 ( ) 运算 符 。 




















表 4.4 ， 标准 类 型 内 建 函 数 


HEC THRE 

cmp (ob jl, obj2) LEE objl #1 obj2, MELAR BRM i: 
I< 0 if objl < obj2 
1 ^ 0 if objl > obj2 
1 == 0 if objl == obj2 

repr (obj) B obj Bl —fPX RIV FIG FAR 


str (obj) AR [HX RE AT VEEL HY FAG BPE 
type (obj) Ta BI — POM RAFAL, FIBRIL type XI 
4.6.1 typeQ 





我 们 现在 来 正式 介绍 typeO . Æ Python2.2 以 前 ， type) 是 内 建 函 数 。 不 过 从 那 时 起 ， 
它 变 成 了 一 个 “工厂 函数 ”在 本 章 的 后 面部 分 我 们 会 讨论 工厂 函数 ， 现 在 你 仍然 可 以 将 type 0 
仅仅 当成 一 个 内 建 函 数 来 看 。 type) 的 用 法 如 下 : 

type (ob ject) 








type) 接受 一 个 对 象 做 为 参数 ， 并 返回 它 的 类 型 。 它 的 返回 值 是 一 个 类 型 对 象 。 


22» type(4) # int type 

«type 'int^ 

222 

2» type( Hello World!’ ) # string type 
«type 'string > 

222 

225 type (type (4) ) # type type 

«type 'type'^ 





e+ 


|[e— —o— — 


Edit By Vheavens 








Edit By Vheavens 








在 上 面 的 例子 里 ， 我 们 通过 内 建 函 数 typeO 得 到 了 一 个 整数 和 一 个 字符 串 的 类 型 ; 为 了 
确认 一 下 类 型 本 身 也 是 类 型 ， 我 们 对 type 0 的 返回 值 再 次 调用 typeO. 注意 type 0) 有趣 的 
输出 ， 它 看 上 去 不 象 一 个 典型 的 Python 数据 类 型 ， 比如 一 个 整数 或 一 个 字符 串 ， 一 些 东 西 被 

个 大 于 号 和 一 个 小 号 包 囊 着 。 这 种 语法 是 为 了 告诉 你 它 是 一 个 对 象 。 每 个 对 象 都 可 以 实现 一 
个 可 打印 的 字符 串 表 示 。 不 过 并 不 总 是 这 样 ， 对 那些 不 容易 显示 的 对 象 来 说 ， Python 会 以 一 
个 相对 标准 的 格式 表示 这 个 对 象 , 格式 通常 是 这 种 形式 : 《object_something or another^, 以 
这 种 形式 显示 的 对 象 通常 会 提供 对 象 类 别 ， 对 象 id 或 位 置 ， 或 者 其 它 合适 的 信息 。 






























































4.6.2 cmpO 





内 建 函 数 cmp O 用 于 比较 两 个 对 象 objl 和 obj2， 如 果 objl 小 于 obj2， 则 返回 一 个 负 整 
数 ， 如 果 objl AF obj2 则 返回 一 个 正 整 数 ， 如 果 objl SF obj2, 则 返回 0。 它 的 行为 非常 
类 似 于 C 语言 的 strcmp 0 函数。 比较 是 在 对 象 之 间 进 行 的 ， 不 管 是 标准 类 型 对 象 还 是 用 户 自 定 
义 对 象 。 如 果 是 用 户 自 定义 对 象 ， cmp 0 会 调用 该 类 的 特殊 方法 _cmp 0 。 在 第 13 章 会 详细 
介绍 类 的 这 些 特殊 方法 。 下 面 是 几 个 使 用 emp 0 内 建 函 数 的 对 数值 和 字符 串 对 象 进行 比较 的 例 


Fe 
> a, b--4 12 


2> cmp (a, b) 
=f 
222 cmp (b, a) 
1 
222 b = -4 
225 cmp (a, b) 
0 
222 
DS» a b = abc’, ‘xyz’ 
>> cmp (a, b) 




















223 

225 cmp (b, a) 
28 

2M» b = abc’ 
225 cmp (a, b) 
0 


在 后 面 我 们 会 研究 cmp C 用 于 其 它 对 象 的 比较 操作 。 


E 


dim 








e + + 
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4.6.3  strO WI rer) (及 ”运算 符 ) 





内 建 函 数 str 和 reprO 或 反 引 号 运算 符 ( ) 可 以 方便 的 以 字符 串 的 方式 获取 对 象 的 





内 容 、 类 型 、 数 值 属性 等 信息 。str 0 函数 得 到 的 字符 串 可 读 性 好 ， 而 repr O 函数 得 到 的 








串通 常 可 以 用 来 重新 获得 该 对 象 ， 通 常情 况 下 obj == ev 














al(repr(obj)) 这 个 等 式 是 成 立 的。 





这 两 个 函数 接受 一 个 对 象 做 为 其 参数 ， 返回 适当 的 字符 
一 些 Python 对 象 来 查看 他 们 的 字符 串 表 示 。 


>D str (4, 53-27) 
” (4, 538-27)’ 

2» 

MS str) 

^q 

202 

2M» str (2e10) 
”20000000000. 0” 


A 
M» str([ü 5, 9, 9/) 
AU. 5 9, GF 

202 

222 repr([0, 5, 9, 9]) 
"10 & 9, Of 

»> 

2> /0 5 49 

"10 5 9 I 


IM y 


Ex 


B. TE RAIS E, 我 们 会 随机 取 


尽管 strO, repr 上 和 ”运算 在 特性 和 功能 方面 都 非常 相似 ， 事实 上 reprO 和 ”做 的 











是 完全 一 样 的 事情 ， 它 们 返回 的 是 一 个 对 象 的 “官方 ”字符 串 表示 ， 








也 就 是 说 绝 大 多 数 情况 下 


可 以 通过 求 值 运算 (使 用 eval O 内 建 函 数 ) 重新 得 到 该 对 象 ， 但 str 0 则 有 所 不 同 。str() 致力 














于 生成 一 个 对 象 的 可 读 性 好 的 字符 串 表示 ， 它 的 返回 结果 











通常 无 法 用 于 eval () 求 值 ， 但 很 适 








合用 于 print 语句 输出 。 需 要 再 次 提醒 一 下 的 是 ， 并 不 是 所 有 repr 0 返回 的 字符 串 都 能 够 用 





eval O 内 建 函 数 得 到 原来 的 对 象 : 
2» eval C type (type)) `) 
File “<stdin>’, line 1 
eval ( type (type)) `) 


SyntaxError: invalid syntax 


+- > 
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T 


dim 





t 





也 就 是 说 repr O 输出 对 Python 比较 友好 ， 而 str () 的 输出 对 人 比较 友好 。 
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很 多 情况 下 这 三 者 的 输出 仍然 都 是 完全 一 样 的 。 





核心 笔记 : 为 什么 我 们 有 了 repr () 还 需要 ? 

在 Python 学 习 过 程 中 , 你 偶尔 会 遇 到 某 个 运算 符 和 某 个 函数 是 做 同样 一 件 事情 。 之 所 以 如 
此 是 因为 某 些 场合 函数 会 比 运算 符 更 适合 使 用 。 举 个 例子 ， 当 处 理 类 似 函 数 这 样 的 可 执行 对 象 
或 根据 不 同 的 数据 项 调用 不 同 的 函数 处 理 时 ， 函 数 就 比 运算 符 用 起 来 方便 。 另 一 个 例子 就 是 双 
EE (sek) 乘 方 运算 和 pow) 内 建 函 数 ，x ek y 和 pow(x, y) 执行 的 都 是 xx 的 y VO. 

译 者 注 : 事实 上 Python 社区 目前 已 经 不 鼓励 继续 使 用 “运算 符 。 





4. 6.4 





typeO 和 isinstance() 








Python 不 支持 方法 
常见 问答 4.75 节 )。 幸 运 的 是 ， 


(参阅 Python 








或 函数 重 载 ， 


因此 你 必须 自己 保 记 
我 们 前 面 4. 


-e| 


虽然 如 此 ， 








调用 的 就 是 你 想 要 的 函数 或 对 象 。 
3. 1 小 节 提 到 的 type O 内 建 函 数 可 








以 帮助 你 确认 这 一 点 。 一 个 名 字 里 究竟 保存 的 是 什么 ? 相当 多 , 尤其 是 这 是 一 个 类 型 的 名 字 时 。 
































确认 接收 到 的 类 型 对 象 的 身份 有 很 多 时 候 都 是 很 有 用 的 。 为 了 达到 此 目的 ，Python 提供 了 一 





个 内 建 函 数 typeO. type (返回 任意 Python 对 象 对 象 的 类 型 ， 而 不 局 限于 标准 类 型 。 让 我 们 
通过 交互 式 解 释 器 来 看 儿 个 使 用 type O 内 建 函 数 返 回 多 种 对 象 类 型 的 例子 : 


2» type(’) 
«type “st > 
222 
2M5s-'xyg 
225 type (s) 
«type ”str > 
222 

>>> type (100) 
«type int’? 
>>> type (0407) 
<type 'complex'^ 
225^ type (OL) 
«type ’ long’ > 
222 type (0. 0) 
«type float’ > 
222 

222 type((]) 
«type “list’> 
2» type(Q) 


T 
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«type 'tuple'^ 

2» type (t}) 

«type dict’? 

22» type (type) 

«type 'type'^ 

2225 

222 class Foo: pass # new-style class 


2 foo = Foo() 
» class Bar (object): pass # new-style class 


2» bar = Bar() 
2255 


22» type (Foo) 
«type 'classobj' ^ 
225 type (foo) 
«type ’ instance’ >? 
2» type (Bar) 
«type ’ type’ > 
2 type (bar) 
<class ” main .Bar/^ 


Python2.2 统一 了 类 型 和 类 ， 如 果 你 使 用 的 是 低 于 Python2. 2 的 解释 器 ， 你 可 能 看 到 不 一 
样 的 输出 结 

22» typer 7) 

«type '!'string > 

225 type (OL) 

«type “long int’> 

2» type (Ü) 

«type ’ dictionary’ > 

22^ type (type) 

«type “builtin function or method’ > 

222 

2» type(Foo) # assumes Foo created as in above 

«type class’ > 

2» type(foo) # assumes foo instantiated also 

«type instance’ > 








除了 内 建 函 数 type () ， 还 有 一 个 有 用 的 内 建 函 数 叫 isinstance ()， 我 们 会 在 第 13 章 CH 











dim 
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举例 




















向 对 象 编程 正式 研 究 这 个 函数 ， 不 过 在 这 里 我 们 还 是 要 简要 介绍 一 下 你 如 何 利用 它 来 
个 对 象 的 类 型 。 














在 例 4.1 中 我 们 提供 了 一 上 段 脚本 来 演示 在 运行 时 环境 使 用 isinstanceO 和 typeO 函数 。 


运行 typechk. py， 我 们 会 得 到 以 下 输出 : 


-69 is a number of type: int 
9999999999999999999999 is a number of type: long 
98.6 is a number of type: float 

5. 241. 9j) is a number of type: complex 

xxx Is not a number at all!! 


Bil 4.1 检查 类 型 (typechk. py) 


随后 我 们 讨论 type O 的 使 用 以 及 怎么 将 这 个 例子 移植 为 改 用 isinstanceO . 


函数 displayNumType () 接受 一 个 数值 参数 ， 它 使 用 内 建 函 数 type 0 来 确认 数值 的 类 型 


《或 不 是 一 个 数值 类 型 )。 


7 #//usr/bin/env python 

2 

3def displayNumType (num) : 

4 print num, is, 

5 if isinstance(num, (int, long, float, complex)): 


6 print 'a number of type:’, type(num). name _ 
7 else: 

8 print 'not a number at al1!/!' 

9 


10 displayNumType (-69) 

11 displayNumType (9999999999999999999999L ) 
12 displayNumType (98. 6) 

13 displayNumType (-5. 2+1. 9j) 

14 displayNumType ( xxx’) 


+- > 





Edit By Vheavens 











e+ 


Edit By Vheavens 


«m, | i 
SEE 
% mS 





例子 进 阶 


原始 
这 个 完成 同样 功能 的 函数 与 本 书 的 第 一 版 中 的 例子 已 经 大 不 相同 : 





def displayNumType (num) : 
print num, “is”, 

if type um == type(0): 
print 'an integer’ 

elif type (num) == type(OL): 
print 'a long’ 

elif type(num) == type (0. 0): 
print 'a float’ 

elif type (num) == type(0*90]j): 
print 'a complex number' 
else: 

print 'not a number at all!!!’ 


由 于 Python 奉行 简单 但 是 比较 慢 的 方式 ， 所 以 我 们 必须 这 么 做 ， 看 一 眼 我 们 原来 的 条 件 
表达 式 : 


if type um == type (0)... 


减少 函数 调用 的 次 数 

如 果 我 们 仔细 研究 一 下 我 们 的 代码 , 会 看 到 我 们 调用 了 两 次 type O 。 要 知道 每 次 调用 函数 
都 会 付出 性 能 代价 ， 如 果 我 们 能 减少 函数 的 调用 次 数 ， 就 会 提高 程序 的 性 能 。 

利用 在 本 章 我 们 前 面 提 到 的 types 模块 ， 我 们 还 有 另 一 种 比较 对 象 类 型 的 方法 ， 那 就 是 
将 检测 得 到 的 类 型 与 一 个 已 知 类 型 进行 比较 。 如 果 这 样 ， 我 们 就 可 以 直接 使 用 type 对 象 而 不 
用 每 次 计算 出 这 个 对 象 来 。 那 么 我 们 现在 修改 一 下 代码 ， 改 为 只 调用 一 次 type O 函数 : 

22^ import types 

2 if type(num) == types. IntType. .. 




















对 象 值 比较 VS 对 象 身份 比较 

在 这 一 章 的 前 面部 分 我 们 讨论 了 对 象 的 值 比较 和 身份 比较 ， 如 果 你 了 解 其 中 的 关键 点 , 你 
就 会 发 现 我 们 的 代码 在 性 能 上 还 不 是 最 优 的 . 在 运行 时 期 , 只 有 一 个 类 型 对 象 来 表示 整数 类 型 . 
也 就 是 说 , type (0), type(42), type(-100) 都 是 同一 个 对 象 : 《type “int >(types. IntType 也 
是 这 个 对 象 ) 





dim 
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如 果 它 们 是 同一 个 对 象 ， 我 们 为 什么 还 要 浪费 时 间 去 获得 并 比较 它们 的 值 呢 (我 们 已 经 知 
道 它们 是 相同 的 了 !)? 所 以 比较 对 象 本 身 是 一 个 更 好 地 方案 . 下 面 是 改进 后 的 代码 : 


if type (num) is types. IntType... # or type(0) 








这 样 做 有 意义 吗 ? 我 们 用 对 象 身 份 的 比较 来 葵 代 对 象 值 的 比较 。 如 果 对 象 是 不 同 的 ， 那 意 
味 着 原来 的 变量 一 定 是 不 同类 型 的 。 (因为 每 一 个 类 型 只 有 一 个 类 型 对 象 ) ， 我 们 就 没有 必要 去 
检查 ( 值 ) 了 。 一 次 这 样 的 调用 可 能 无 关 紧 要 ， 不 过 当 很 多 类 似 的 代码 遍布 在 你 的 应 用 程序 中 的 
时 候 ， 就 有 影响 了 。 























减少 查询 次 数 

这 是 一 个 对 前 一 个 例子 较 小 的 改进 ， 如 果 你 的 程序 像 我 们 的 例子 中 做 很 多 次 比较 的 话 ， 程 
序 的 性 能 就 会 有 一 些 差异 。 为 了 得 到 整数 的 对 象 类 型 ， 解 释 器 不 得 不 首先 查找 types 这 个 模块 
的 名 字 ， 然 后 在 该 模块 的 字典 中 查找 IntType。 通 过 使 用 from-import， 你 可 以 减少 一 次 查询 : 

from types import IntType 





if type(num) is IntType... 


$ 惯例 和 代码 风格 E: 
Python2. 2 对 类 型 和 类 的 统一 导致 isinstance O 内 建 函 数 的 使 用 率 大 大 增加 。 我 们 将 在 
第 13 章 〈 面 向 对 象 编 程 ) 正式 介绍 isinstance ()， 在 这 里 我 们 简单 浏览 一 下 。 











这 个 布尔 函数 接受 一 个 或 多 个 对 象 做 为 其 参数 ， 由 于 类 型 和 类 现在 都 是 一 回 事 ， int 现在 
既是 一 个 类 型 又 是 一 个 类 。 我 们 可 以 使 用 isinstance() 函数 来 让 我 们 的 if 语句 更 方便 ， 并 具 
有 更 好 的 可 读 性 。 





if isinstance(num, int)... 

在 判断 对 象 类 型 时 也 使 用 isinstanceO 已 经 被 广 为 接 受 ， 我 们 上 面 的 typechk. py 脚本 
最 终 与 改 成 了 使 用 isinstance () 函数 。 值 得 一 提 的 是 ， isinstance () 接 受 一 个 类 型 对 象 的 元 
组 做 为 参数 ， 这 样 我 们 就 不 必 像 使 用 type () 时 那样 写 一 堆 if-elif-else 判断 了 。 


4.6.5 Python 类 型 运算 符 和 内 建 函 数 总 结 


# 4.5 列 出 了 所 有 运算 符 和 内 建 函 数 ， 其 中 运算 符 顺序 是 按 优先 级 从 高 到 低 排 列 的 。 同 一 
种 灰 度 的 运算 符 拥 有 同样 的 优先 级 。 注 意 在 operator 模块 中 有 这 些 ( 和 绝 大 多 数 Python) 运算 
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符 相 应 的 同 功能 的 函数 可 供 使 用 。 
表 4.5 标准 类 型 运算 符 和 内 建 函 数 








Operator/Function Description Result? 

string 
= String representation st 
cmp (obji, obj2) Compares two objects in 
repr (obj) String representation st 
str (obj) String representation st 
type (obj) Determines object type typ 

< Less than boo 

> Greater than boo 

<= Less than or equal to boo 

>= Greater than or equal to boo 

== Equal to boo 

l= Not equal to boo 

<> Not equal to boo 

is The same as boo 

is not Not the same as boo 

not Logical negation boo 

and Logical conjunction boo 

or Logical disjunction boo 


布尔 比较 总 是 返回 True BK False 


E 
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4. T 


Python 2.2 统一 了 类 型 和 类 ， 
所 谓 内 建 转换 函数 象 int ()，type ()，1ist() 等 等 ， 
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类 型 工厂 函数 








所 有 的 内 建 类 型 现在 也 都 是 类 ， 在 这 基础 之 上 ， 


—ee 





原来 的 
现在 都 成 了 工厂 函数 。 也 就 是 说 虽然 他 


们 看 上 去 有 点 象 函 数 ， 实质 上 他 们 是 类 。 当 你 调用 它们 时 ， 实际 上 是 生成 了 该 类 型 的 一 个 实 


例 ， 就 象 工厂 生产 货物 一 样 。 








下 面 这 些 大 家 熟悉 的 工厂 函数 在 老 的 Python 版 里 被 称 为 内 建 函 数 : 
€ intQ, long(), float(), complex () 


€ str(), unicode(), basestring( 
@ listO, tupleO 
© typeO 





以 前 没有 工厂 函数 的 其 他 类 型 ， 现 在 也 都 有 了 工厂 函数 。 除 此 之 外 ， 那 些 支 持 新 风格 的 类 
的 全 新 的 数据 类 型 ， 也 添加 了 相应 的 工厂 函数 。 下 面 列 出 了 这 些 工厂 函数 : 





4. 8 








dict Q 
€ bool() 
@set(), frozenset () 
@ object () 
€ classmethod () 
staticmethod () 
super () 
property () 
fileQ 


标准 类 型 的 分 类 


A RAE Ti P ER S EAM, Rudi] VEAMOS Python 的 “基本 内 建 数据 对 象 原 


始 类 型 ”。 





“FEAR”, 
“数据 ” 
“对 象 ”， 








是 指 这 些 类 型 都 是 Python 提供 的 标准 或 核心 类 型 。 


是 由 于 这 些 类 型 是 Python 默认 就 提供 的 
因为 他 们 用 于 一 般 数 据 存 储 
因为 对 象 是 数据 和 功能 的 默认 抽象 
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“原始 ”因为 这 些 类 型 提供 的 是 最 底层 的 粒度 数据 存储 
e “类 型 ”， 因 为 他 们 就 是 数据 类 型 








不 过 ， 上 面 这 些 描述 实际 上 并 没有 告诉 你 每 个 类 型 如 何 工作 以 及 它们 能 发 挥 什么 作用 。 事 
KE, 几 个 类 型 共享 某 一 些 的 特性 ， 比 如 功能 的 实现 手段 ， 另 一 些 类 型 则 在 访问 数据 值 方面 
有 一 些 共同 之 处 。 我 们 感 兴趣 的 还 有 这 些 类 型 的 数据 如 何 更 新 以 及 它们 能 提供 什么 样 的 存储 。 
有 三 种 不 同 的 模型 可 以 帮助 我 们 对 基本 类 型 进行 分 类 ， 每 种 模型 都 展示 给 我 们 这 些 类 型 之 间 的 
相互 关系 。 这 些 模型 可 以 帮助 我 们 更 好 的 理解 类 型 之 间 的 相互 关系 以 及 他 们 的 工作 原理 。 


4.8.1 存储 模型 


我 们 对 类 型 进行 分 类 的 第 一 种 方式 ， 就 是 看 看 这 种 类 型 的 对 象 能 保存 多 少 个 对 象 。 Python 
的 类 型 ， 就 象 绝 大 多 数 其 它 语言 一 样 ， 能 容纳 一 个 或 多 个 值 。 一 个 能 保存 单个 字面 对 象 的 类 型 
我 们 称 它 为 原子 或 标量 存储 ， 那 些 可 容纳 多 个 对 象 的 类 型 ， 我 们 称 之 为 容器 存储 。( 容 器 对 象 有 
时 会 在 文档 中 被 称 为 复合 对 象 , 不 过 这 些 对 象 并 不 仅仅 指 类 型 , 还 包括 类 似 类 实例 这 样 的 对 象 ) 
$ 容器 类 型 又 带 来 一 个 新 问题 ， 那 就 是 它 是 否 可 以 容纳 不 同类 型 的 对 象 。 所 有 的 Python 容器 对 $ 


























象 都 能 够 容纳 不 同类 型 的 对 象 。 表 4. 6 按 存储 模型 对 Python 的 类 型 进行 了 分 类 。 





字符 串 看 上 去 像 一 个 容器 类 型 ， 因 为 它 “ 包 含 ” 字 符 〈 并 且 经 常 多 于 一 个 字符 )， 不 过 由 
T Python 并 没有 字符 类 型 〈 参 见 章节 4.8)， 所 以 字符 串 是 一 个 自我 包含 的 文字 类 型 。 




















表 4.6 以 存储 模型 为 标准 的 类 型 分 类 


存储 模型 

分 类 Python 类 型 

AGBÁESCTOGSE BE DAHREK), FIFE (PRELP) 
BRATS A. A, FA 


4.8.2 ”更 新 模型 


另 一 种 对 标准 类 型 进行 分 类 的 方式 就 是 ， 针对 每 一 个 类 型 问 一 个 问题 :“ 对 象 创 建成 功 之 
后 ， 它 的 值 可 以 进行 更 新 吗 ? ” 在 前 面 我 们 介绍 Python 数据 类 型 时 曾经 提 到 ， 某 些 类 型 允许 
他 们 的 值 进行 更 新 ， 而 另 一 些 则 不 允许 。 可 变 对 象 允 许 他 们 的 值 被 更 新 ， 而 不 可 变 对 象 则 不 允 





dim 
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许 他 们 的 值 被 更 改 。 表 4. 7 列 出 了 支持 更 新 和 不 支持 更 新 的 类 型 。 
看 完 这 个 表 之 后 , 你 可 能 马上 冒 出 一 个 问题 :等 等 , 你 说 数值 和 字符 串 对 象 是 不 可 改变 的 ? 
看 看 下 面 的 例子 !”: 


"Python numbers and strings’ 


X Et 

x = 'are immutable?!? What gives?’ 
i-0 

i-it*li 





没 错 ， 是 这 样 ， 不 过 你 还 没有 搞 清楚 幕后 


“在 我 看 来 ， 这 可 不 象 是 不 可 变 对 象 的 行为 !” 
对 象 。 就 是 这 样 ， 请 多 


的 真相 。 上 面 的 例子 中 ， 事 实 上 是 一 个 新 对 象 被 创建 ， 然 后 它 取代 了 旧 











BE 1X B. 
新 创建 的 对 象 被 关联 到 原来 的 变量 名 ， 旧 对 象 被 丢弃 ， 垃 圾 回收 器 会 在 适当 的 时 机 回收 这 
些 对 象 。 你 可 以 通过 内 建 函 数 idO 来 确认 对 象 的 身份 在 两 次 赋值 前 后 发 生 了 变化 。 

















T 


表 4.7 ”以 更 新 模型 为 标准 的 类 型 分 类 


更 新 模型 
分 类 Python 类 型 
HJ AEZ 7B WK, FA 


AN ADAE RP. FIR, TA 


下 面 我 们 在 上 面 的 例子 里 加 上 idO 调用 ， 就 会 清楚 的 看 到 对 象 实际 上 已 经 被 蔡 换 了 : 


2M» x = 'Python numbers and strings’ 
2M» print id(x) 

16191392 

> x = are immutable?!? What gives?’ 
2M» print id(x) 

16191232 

D> 1=0 

2M» print id(i) 

7749582 

> 1=i td 

2M» print id(i) 
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7749600 

你 看 到 的 身份 数字 很 可 能 和 我 不 同 ， 每 次 执行 这 些 数 字 也 会 不 同 ， 这 是 正常 的 。 这 个 数字 
与 该 对 象 当时 分 配 的 内 存 地 址 密切 相关 。 因 此 不 同 的 机 器 ， 不 同 的 执行 时 间 都 会 生成 不 同 的 对 
象 映 份 。 男 一 类 对 象 ， 列表 可 以 被 修改 而 无 须 蔡 换 原 始 对 象 ， 看 下 面 的 例子 : 














2» alist = [’ ammonia’, 83, 85, 'lady'] 
2225 alist 
[ ammonia’, 83, 85, 'lady'] 
222 
2» aListí2] 
85 
222 
2» id(aList) 
135443480 
222 
2» aList[2] = aListí2] + 1 
2» alist[3] = 'stereo' 
22» alist 
[ ammonia’, 83, 86, 'stereo'] 
222 
2» id(aList) 
135443480 
222 
2» alist. append ( gaudy’) 
2» alist. append (aList[2] + 1) 


2225 alist 

[ ammonia’, 88, 86, 'stereo', ‘gaudy’, 87] 
222 

2» id(aList) 

135443480 


注意 列表 的 值 不 论 怎么 改变 ， 列表 的 ID 始终 保持 不 变 。 


4.8.3 访问 模型 








尽管 前 面 两 种 模型 分 类 方式 在 介绍 Python 时 都 很 有 用 , 它们 还 不 是 区 分 数据 类 型 的 首要 模 
型 。 对 这 种 目的 ， 我 们 使 用 访问 模型 。 也 就 是 说 根据 访问 我 们 存储 的 数据 的 方式 对 数据 类 型 进 
行 分 类 。 在 访问 模型 中 共有 三 种 访问 方式 : 直接 存 取 ， 顺 序 ， 和 映射。 表 4. 8 按 访问 方式 对 数 
据 类 型 进行 了 分 类 。 
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对 非 容器 类 型 可 以 直接 访问 。 所 有 的 数值 类 型 都 归 到 这 一 类 。 


序列 类 型 是 指 容器 内 的 元 素 按 从 0 开始 的 索引 顺序 访问 。 一 次 可 以 访问 一 个 元 素 或 多 个 元 
素 ， 也 就 是 大 家 所 了 解 的 切片 (slice) 。 字 符 串 ， 列 表 和 元 组 都 归 到 这 一 类 。 我 们 前 面 提 到 过 ， 
Python 不 文 持 字符 类 型 因此， 虽然 字符 串 是 简单 文字 类 型 ， 因 为 它 有 能 力 按 照 顺 序 访问 子 字 
符 串 ， 所 以 也 将 它 归 到 序列 类 型 。 


























映射 类 型 类 似 序 列 的 索引 属性 , 不 过 它 的 索引 并 不 使 用 顺序 的 数字 偏 移 量 取 值 ， 它 的 元 素 
无 序 存放 ， 通 过 一 个 唯一 的 key 来 访问 ， 这 就 是 映射 类 型 ， 它 容纳 的 是 哈 希 键 - 值 对 的 集合 。 








我 们 在 以 后 的 章节 中 将 主要 使 用 访问 模型 ,详细 介绍 各 种 访问 模型 的 类 型 ， 以 及 某 个 分 类 
的 类 型 之 间 有 哪些 相同 之 处 (比如 运算 符 和 内 建 函 数 )， 然后 讨论 每 种 Python 标准 类 型 。 所 有 
类 型 的 特殊 运算 符 ， 内 建 函 数 ， 及 方法 都 会 在 相应 的 章节 特别 说 明 。 


























为 什么 要 对 同样 的 数据 类 型 再 三 分 类 呢 ? 首先 ， 我 们 为 什么 要 分 类 ? 因为 Python 提供 
了 高 级 的 数据 结构 ,我 们 需要 将 那些 原始 的 类 型 和 功能 强大 的 扩展 类 型 区 分 开 来 。 另 一 个 原因 
就 是 这 有 助 于 搞 清 楚 某 种 类 型 应 该 具有 什么 行为 。 举 例 来 说 ， 如 果 我 们 基本 上 不 用 问 自己 “ 列 
表 和 元 组 有 什么 区 别 ? ”或 “什么 是 可 变 类 型 和 不 可 变 类 型 ? ”这 些 问题 的 时 候 ， 我 们 也 就 达 
到 了 目的 。 最 后 ， 茶 些 分 类 中 的 所 有 类 型 具有 一 些 相同 的 特性 。 一 个 优秀 的 工匠 应 该 知道 他 或 
她 的 工具 箱 里 都 有 哪些 宝贝 。 





























表 4.7 以 访问 模型 为 标准 的 类 型 分 类 


访问 模型 

分 类 Python 类 型 
ARI AF 

Wii Fr IEI FIFE, WR, TH 
PRET TZ fe T 


de 4.9 标准 类 型 分 类 
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IN ZEZSU TRAY EPRE We JERAN 
数字 Scalar 不 可 更 改 直接 访问 
字符 串 Scalar 不 可 更 改 顺序 访问 
列表 Container 可 更 改 顺序 访问 
元 组 Container 不 可 更 改 顺序 访问 
字典 Container 可 更 改 映射 访问 





另 一 个 问题 就 是 ， “为 什么 要 用 这 么 多 不 同 的 模型 或 从 不 同 的 方面 来 分 类 ? ” 所 有 这 些 
数据 类 型 看 上 去 是 很 难 分 类 的 。 它 们 彼此 都 有 着 错综复杂 的 关系 ， 所 有 类 型 的 共同 之 处 最 好 能 
揭示 出 来 ， 而 且 我 们 还 想 揭 示 每 种 类 型 的 独到 之 处 。 没 有 两 种 类 型 横 跨 所 有 的 分 类 。( 当 然 ， 所 
有 的 数值 子 类 型 做 到 了 这 一 点 ， 所 以 我 们 将 它们 归纳 到 一 类 当中 ) 。 最 后 ， 我 们 确信 搞 清 所 有 
类 型 之 间 的 关系 会 对 你 的 开发 工作 有 极 大 的 帮助 。 你 对 每 种 类 型 的 了 解 越 多 ， 你 就 越 能 在 自己 
的 程序 中 使 用 恰当 的 类 型 以 达到 最 佳 的 性 能 。 
























































我 们 提供 了 一 个 汇总 表 ( 表 4. 9)。 表 中 列 出 了 所 有 的 标准 类 型 ， 我 们 使 用 的 三 个 模型 ， 
以 及 每 种 类 型 归 入 的 分 类 。 


不 支持 的 类 型 


在 我 们 深入 了 解 各 个 标准 类 型 之 前 , 我 们 在 本 章 的 结束 列 出 Python 目前 还 不 支持 的 数据 类 
型 。 


t 
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char 5K byte 


Python 没有 char Bk byte 类 型 来 保存 单一 字符 或 8 比特 整数 。 你 可 以 使 用 长 度 为 1 的 字 
符 串 表示 字符 或 8 比特 整数 。 





HET 














Python 替 你 管理 内 存 ， 因 此 没有 必要 访问 指针 。 在 Python 中 你 可 以 使 用 id O 函数 得 到 一 
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个 对 象 的 身份 号 ， 这 是 最 接近 于 指针 的 地 址 。 因 为 你 不 能 控制 这 个 值 ,所 以 其 实 没有 太 大 意义 。 
其 实在 Python 中， 一 切 都 是 指针 。 





int vs short vs long 

Python 的 普通 整数 相当 于 标准 整数 类 型 ， 不 需要 类 似 C 语言 中 的 int, short, long 这 三 
种 整数 类 型 。 事实 上 Python 的 整数 实现 等 同 于 C 语 言 的 长 整数 。 由 于 Python 的 整 型 与 长 整 型 
密切 融合 ， 用 户 几 乎 不 需要 担心 什么 。 你 仅 需 要 使 用 一 种 类 型 ， 就 是 Python 的 整 型 。 即 便 
数值 超出 整 型 的 表达 范围 ， 比如 两 个 很 大 的 数 相 乘 ， Python 会 自动 的 返回 一 个 长 整数 给 你 而 
不 会 报错 。 





























float VS double 

C 语言 有 单 精 度 和 双 精 度 两 种 浮 点 类 型 。 Python 的 浮 点 类 型 实际 上 是 C 语言 的 双 精 度 浮 

点 类 型 。Python 认为 同时 支持 两 种 浮 点 类 型 的 好 处 与 支持 两 种 浮 点 类 型 带 来 的 开销 不 成 比例 ， 

所 以 Python 决定 不 支持 单 精度 浮 点 数 。 对 那些 宁愿 放弃 更 大 的 取 值 范围 而 需要 更 高 精确 度 的 

用 户 来 说 ， Python 还 有 一 种 十 进 制 浮 点 数 类 型 Decimal， 不 过 你 必须 导入 decimal 模块 才 可 
+ 以 使 用 它 。 浮 点 数 总 是 不 精确 的 。Decimals 则 拥有 任意 的 精度 。 在 处 理 金 钱 这 类 确定 的 值 时 ， 







































































Decimal 类 型 就 很 有 用 。 在 处 理 重 量 ， 长 度 或 其 它 度量 单位 的 场合 ， float 足够 用 了 。 








4. 10 练习 





4-1. Python 对 象 。 与 所 有 Python 对 象 有 关 的 三 个 属性 是 什么 ?请 简单 的 描述 一 下 。 

4-2. 类型。 不 可 更 改 〈immutable) 指 的 是 什么 ? Python 的 哪些 类 型 是 可 更 改 的 
(mutable)， 哪 些 不 是 ? 

4-3. XE. W Python 类 型 是 按照 顺序 访问 的 ， 它 们 和 映射 类 型 的 不 同 是 什么 ? 

4-4.  typeO. A tee ae type O WUTA? type O 返回 的 对 象 是 什么 ? 

4-4. str) 和 repr(0。 内 建 函数 str O0 5E repr) 之 间 的 不 同 是 什么 ? 哪 一 个 等 价 于 反 
引号 ( ) 运 算 符 ? 。 

4-6. 对 象 相 等 。 您 认为 type(a) == type (b) F type (a) istype(b) 之 间 的 不 同 是 什么 ? 
为 什么 会 选择 后 者 ? 函数 isinstance () 与 这 有 什么 关系 ? 

4-7. WX dir (0 。 在 第 二 章 的 几 个 练习 中 ， 我 们 用 内 建 函数 dir 0 做 了 几 个 实验 ， 
它 接受 一 个 对 象 ， 然 后 给 出 相应 的 属性 。 请 对 types 模块 做 相同 的 实验 。 记 下 您 熟悉 的 类 型 ， 
包括 您 对 这 些 类 型 的 认识 ， 然 后 记 下 你 还 不 熟悉 的 类 型 。 在 学 习 Python 的 过 程 中 ， 你 要 逐步 将 
“不 熟悉 ”的 类 型 变 得 “熟悉 ”起 来 。 
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列表 和 元 组 。 列 表 和 元 组 的 相同 点 是 什么 ? 不 同 点 是 什么 ? 





XE EA PUB: 


请 问 下 面 各 表达 式 的 输出 是 什么 ? 为 什么 ? 


4 - 8. 

4-9. 2, 58 
a — I0 

b = I0 

c = 100 

d = 100 

e = 10.0 
f = 10.0 
(a) ais db 
(b) cisd 
(el eisf 
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数 的 简介 
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Chapter 


本 章 的 主题 是 Python 中 的 数字 。 我 们 会 详细 介绍 每 一 种 数字 类 型 ， 它 们 适用 的 各 种 运算 
以 及 用 于 处 理 数字 的 内 建 函数 。 在 本 章 的 末尾 ， 我 们 简单 介绍 了 几 个 标准 库 中 用 于 处 理 




















数字 的 模块 。 


5.1 数字 类 型 


数字 提供 了 标量 贮存 和 直接 访问 。 它 是 不 可 更 改 类 型 ， 也 就 是 说 变更 数字 的 值 会 生成 新 的 

















对 象 。 当 然 ， 这 个 过 程 无 论 对 程序 员 还 是 对 用 户 都 是 透明 的 ， 并 不 会 影响 软件 的 开发 方式 。 


+- > - 


Python 支持 多 种 数字 类 型 : 整 型 、 长 整 型 、 布 尔 型 、 双 精度 浮 点 型 、 十 进 制 浮 点 型 和 复数 。 





如 何 创建 数值 对 象 并 用 其 赋值 
(数字 对 象 ) 











创建 数值 对 象 和 给 变量 赋值 一 样 同样 简单 : 





anint = 1 
along = —9999999999999999[ 
aFloat = 3. 141592653589793238 4626433832795 
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aComplex = 1.2344. 567] 


如 何 更 新 数字 对 象 


通过 给 数字 对 象 〈 重 新 ) 赋值 ， 您 可 以 “更 新 ”一 个 数值 对 象 。 我 们 之 所 以 给 更 新 这 两 个 
字 加 上 引号 ， 是 因为 实际 上 你 并 没有 更 新 该 对 象 的 原始 数值 。 这 是 因为 数值 对 象 是 不 可 改变 对 
象 。Python 的 对 象 模型 与 常规 对 象 模型 有 些 不 同 。 你 所 认为 的 更 新 实际 上 是 生成 了 一 个 新 的 数 
值 对 象 ， 并 得 到 它 的 引用 。 











在 学 习 编程 的 过 程 中 ， 我 们 一 直接 受 这 样 的 教育 ， 变量 就 像 一 个 盒子 ， 里 面 装 着 变量 的 
值 。 在 Python rH, 变量 更 像 一 个 指针 指向 装 变量 值 的 盒子 。 对 不 可 改变 类 型 来 说 ， 你 无 法 
改变 盒子 的 内 容 ， 但 你 可 以 将 指针 指向 一 个 新 盒子 。 每 次 将 男 外 的 数字 赋 给 变量 的 时 候 ， 实 际 
上 创建 了 一 个 新 的 对 象 并 把 它 赋 给 变量 . (不 仅仅 是 数字 ， 对 于 所 有 的 不 可 变 类 型 ， 都 是 这 么 回 
事 ) 

















anint += 7 
aFloat = 2. 718281828 


$ 如 何 删除 数字 对 象 k 


按照 Python 的 法 则 ， 你 无 法 真正 删除 一 个 数值 对 象 ， 你 仅仅 是 不 再 使 用 它 而 已 。 如 果 你 
实际 上 想 删 除 一 个 数值 对 象 的 引用 ， 使 用 del 语句 (参见 3. 5.6 小 节 )。 删除 对 象 的 引用 之 
ja, 你 就 不 能 再 使 用 这 个 引用 (变量 名 )， 除非 你 给 它 赋 一 个 新 值 。 如 果 试 图 使 用 一 个 已 经 被 
删除 的 对 象 引用 ， 会 引发 NameError 异常 。 











del anint 
del aLong, aFloat, aComplex 


好 了 ， 既然 你 已 经 了 解 如 何 创建 和 更 新 数值 对 象 ， 那么 来 看 下 Python 的 四 种 主要 数字 类 
型 。 

5. 2 整 型 

Python 有 几 种 整数 类 型 。 布 尔 类 型 是 只 有 两 个 值 的 整 型 。 常 规整 型 是 绝 大 多 数 现代 系统 都 


能 识别 的 整 型 。Python 也 有 长 整数 类 型 。 然 而 ， 它 表示 的 数值 大 小 远 超 过 C 语言 的 长 整数 。 
下 面 我 们 先 来 了 解 一 下 这 些 类 型 , 然后 再 来 研究 那些 用 于 Python 整数 类 型 的 运算 符 和 内 建 函 数 。 

















dim 
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5.2.1 布尔 型 


Python 从 版 本 2.3 开始 支持 布尔 类 型 ,该 类 型 的 取 值 范围 只 有 两 个 值 , 也 就 是 布尔 值 True 
和 布尔 值 False。 我 们 会 在 本 章 的 末尾 一 节 5. 7. 1 详细 讲解 布尔 对 象 。 


5.2.2 标准 整数 类 型 


Python 的 标准 整数 类 型 是 最 通用 的 数字 类 型 。 在 大 多 数 32 位 机 器 上 ， 标 准 整 数 类 型 的 取 
值 范 围 是 -231 “到 231-1， 也 就 是 -2, 147, 483, 648 到 2, 147, 483, 647。 如 果 在 64 位 机 器 上 使 
用 64 位 编译 器 编译 Python， 那 么 在 这 个 系统 上 的 整数 将 是 64 位 。 下 面 是 一 些 Python 标准 整 
数 类 型 对 象 的 例子 : 





0101 84 -237 0x80 017-680 -0X92 





Python 标准 整数 类 型 等 价 于 C 的 《有 符号 ) 长 整 型 。 整数 一 般 以 十 进 制 表 示 , 但 是 Python 
也 支持 八进制 或 十 六 进 制 来 表示 整数 。 如 果 八 进 制 整数 以 数字 “0” 开 始 ， 十 六 进 制 整数 则 以 














“Ox” 或 4 0y 开始 。 


5.2.3 长 整 型 








关于 Python 长 整数 类 型 我 们 必须 要 提 的 是 ， 请 不 要 将 它 和 C 或 其 它 编译 型 语言 的 长 整数 
类 型 混淆 。 那 些 语言 的 长 整数 典型 的 取 值 范围 是 32 位 或 64 位 。Python 的 长 整数 类 型 能 表达 的 
数值 仅仅 与 你 的 机 器 支持 的 (虚拟 ) 内存 大 小 有 关 ， 换 句 话说 ， Python 能 轻松 表达 很 大 很 大 很 
大 的 整数 。 

长 整数 类 型 是 标准 整数 类 型 的 超 集 ， 当 你 的 程序 需要 使 用 比 标准 整数 类 型 更 大 的 整数 时 ， 
长 整数 类 型 就 有 用 武之 地 了 。 在 一 个 整数 值 后 面 加 个 站 《大 写 或 小 写 都 可 以 )， 表 示 这 个 整数 是 
长 整数 。 这 个 整数 可 以 是 十 进 制 ， 八 进 制 ， 或 十 六 进 制 。 下 面 是 一 些 长 整数 的 例子 : 


























16384L  -Ox4E8L 017L -21474836481  052144364L 
2997924581 OxDECADEDEADBEEFBADFEEDDEAL —5432101234L 
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核心 风格 : 用 大 写字 母 “L” 表 示 长 整数 

尽管 Python 也 支持 用 小 写字 母 L 标记 的 长 整 型 ,但 是 我 们 郑重 推荐 您 仅 使 用 大 写 的 “L”， 
这 样 能 有 效 避 免 数 字 1 和 小 写 L 的 混淆 .Python 在 显示 长 整数 类 型 数值 的 时 候 总 是 用 大 写 “L ”, 
目前 整 型 和 长 整 型 正在 逐渐 缓慢 的 统一 ， 您 只 有 在 对 长 整数 调用 repr O 函数 时 才 有 机 会 看 到 
“L”, 如 果 对 长 整数 对 象 调用 str () 函数 就 看 不 到 L 。 举 例如 下 : 

222 aLong = 9999999991 

222 aLong 

999999999 


22^ print aLong 
999999999 


5.2.4 整 型 和 长 整 型 的 统一 


这 两 种 整数 类 型 正在 逐渐 统一 为 一 种 。 在 Python 2. 2 以 前 ， 标 准 整数 类 型 对 象 超出 取 值 范 
围 会 溢出 〈 比 如 上 面 提 到 的 大 于 232 的 数 )， 但 是 从 Python2. 2 以 后 就 再 也 没有 这 样 的 错误 了 。 


Python 2. 1 


>>>) 9999 sek 8 
Traceback (most recent call last): 
File “<stdin>”, line 1, in ? 


OverflowError: integer exponentiation 








Python 2.2 
>>> 9999 ** 8 
99920027994400699944002799920001L 


移 除 这 个 错误 是 第 一 步 。 下 一 步 修改 位 移 位 ; 左 移 比 特 导致 出 界 〈 导 致 0 值 ) 在 过 去 是 
经 常 可 能 发 生 的 事 ; 











MA2««32 





. 
+- > e. 
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在 Python2. 3 中 ， 这 个 操作 产生 一 个 警告 ， 不 过 在 2.4 版 里 移 除 了 这 个 Warning, 并 且 
这 步 操作 生成 了 一 个 真正 的 长 整数 。 

Python 2.3 

222 2 OSA 32 

. main :1: FutureWarning: x<<y losing bits or changing sign will return a long 
in Python 2.4 

and up 

0 


Python 2.4 
>>> 2 << 32 
8589934592L 





不 远 的 将 来 ， 至 少 普 通用 户 会 几乎 感觉 不 到 长 整 型 的 存在 。 必 要 时 整 型 会 悄悄 自动 转换 为 
长 整 型 。 当 然 ， 那 些 要 调用 C 的 人 仍然 可 以 继续 使 用 这 两 种 整数 类 型 ， 因为 C 代码 必须 区 分 不 
同 的 整数 类 型 。 如 果 你 想 详 细 了 解 标准 整 型 与 长 整 型 整合 的 信息 ， 请 阅读 PEP23T. 


5.3” 双 精度 浮 点 数 


Python 中 的 浮 点 数 类 似 C 语言 中 的 double 2878, — 是 双 精 度 浮 点 数 ， 可 以 用 直接 的 十 进 制 
或 科学 计数 法 表示 。 每 个 浮 点 数 占 8 个 字 节 (64 比特 ), 完全 遵守 IEEE754 号 规范 (52M/11E/1S)， 
其 中 52 个 比特 用 于 表示 底 ，11 个 比特 用 于 表示 指数 〈 可 表示 的 范围 大 约 是 正 负 10 的 308.25 
次 方 )， 剩 下 的 一 个 比特 表示 符号 。 这 看 上 去 相当 完美 ， 然 而 ， 实 际 精度 依赖 于 机 器 架构 和 创 
建 Python 解释 器 的 编译 器 。 

浮 点 数值 通常 都 有 一 个 小 数 点 和 一 个 可 选 的 后 级 e (大 写 或 小 写 ， 表 示 科 学 计数 法 )。 在 e 
和 指数 之 间 可 以 用 正 (+) Ra C) 表示 指数 的 正 负 〈 正 数 的 话 可 以 省 略 符号 )。 下 面 是 一 些 典 


















































型 的 浮 点 数值 的 例子 : 
0.0 BITE. 1.6 -5.555567119 ^ 96e3 * 1.0 
4.3e25 9.384e-23 -2.172818 float (12) 1. 000000001 
3.1416 4.2bE-10 -90. 6. 022e23 -1. 609E-19 











Edit By Vheavens 


97 0 0 0 0 0 0 0 8 


二 一 —o— 一 全 





dim 


Edit By Vheavens 





5.4 复数 


在 很 久 以 前 ， 数 学 家 们 被 下 面 这 样 的 等 式 困 扰 。 

x = -1 

这 是 因为 任何 实数 〈 无 论 正 数 还 是 负数 ) 乘 以 自己 总 是 会 得 到 一 个 非 负 数 。 一 个 数 怎么 可 
以 乘 以 自己 却 得 到 一 个 负数 ? 没有 这 样 的 实数 存在 。 就 这 样 ， 直到 18 世纪 ， 数学 家 们 发 明了 
一 个 虚拟 的 数 i (或 者 叫 j, 看 你 读 的 是 哪 本 教科 书 了 ) 

EN | 

JEN 

基于 这 个 特殊 的 数 (或 者 称 之 为 概念 )， 数 学 从 此 有 了 一 个 新 的 分 支 。 现 在 虚数 已 经 广泛 应 
用 于 数值 和 科学 计算 应 用 程序 中 。 一 个 实数 和 一 个 虚数 的 组 合 构成 一 个 复数 。 一 个 复数 是 一 对 
有 序 浮 点 数 (x，y) 。 表 示 为 x + yj, 其 中 x 是 实数 部 分 ，y 是 虚数 部 分 。 




















渐渐 的 复数 在 日 常 运算 , 机 械 , 电子 等 行业 获得 了 广泛 的 应 用 。 由 于 一 些 研究 人 员 不 断 的 重 
复制 造 用 于 复数 运算 的 工具 ， 在 很 久 以 前 的 Pythonl.4 版 本 里 ， 复 数 终于 成 为 一 个 真正 的 
Python 数据 类 型 。 


























下 面 是 Python 语言 中 有 关 复 数 的 几 个 概念 : k 





虚数 不 能 单独 存在 ， 它 们 总 是 和 一 个 值 为 0.0 的 实数 部 分 一 起 来 构成 一 个 复数 。 
复数 由 实数 部 分 和 虚数 部 分 构成 

表示 虚数 的 语法 : real+imagj 

实数 部 分 和 虚数 部 分 都 是 浮 点 数 

虚数 部 分 必须 有 后 缀 j Jo 














下 面 是 一 些 复数 的 例子 : 
64. 375+1j  4.23-8.5j 0.23-8.55j 1. 23e-045+6. 7e*089j 
6. 23+1.5j  -1.23-875] 0+1j 9. 80665-8.31441J . -.022440j 


5. 4.1 复数 的 内 建 属性 


复数 对 象 拥有 数据 属性 (参见 4.1.1 节 )， 分 别 为 该 复数 的 实 部 和 虚 部 。 复 数 还 拥有 
conjugate 方法 ， WHA CH GR AZ BEER BOT Ro CPA ETE EAR YMO. SEDE 
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表 5.1 复数 属性 











属性 描述 
num. real 该 复数 的 实 部 


num num. imag 该 复数 的 虚 部 
num.conjugate() RIBHZ EAS gue A 


222 aComplex = -8. 333-1. 477 
222 aComplex 

(-8. 333-1. 47.) 

22^ aComplex. real 

-6. 333 

>>> aComplex. imag 

=1, 47 

22» aComplex. conjugate () 
(8. 33341. 47 y) 











表 5. 1 描述 了 复数 的 所 有 属性 











5.5 运算 符 
数值 类 型 可 进行 多 种 运算 。 从 标准 运算 符 到 数值 运算 符 ， 甚 至 还 有 专门 的 整数 运算 符 。 


5.5.1 混合 模式 运算 符 





也 许 你 还 记得 ， 过 去 将 两 个 数 相 加 时 ， 你 必须 努力 保证 操作 数 是 合适 的 类 型 。 自 然而 然 的 ， 
加 法 总 是 使 用 + 号 ， 然而 在 计算 机 语言 看 来 这 件 事 没 那么 简单 ， 因 为 数字 又 有 很 多 不 同 的 类 
型 。 














当 两 个 整数 相 加 时 ， + 号 表示 整数 加 法 ， 当 两 个 浮 点 数 相 加 时 ， + 表示 浮 点 数 加 法 ， 依 
此 类 推 。 在 Python H, 甚至 非 数字 类 型 也 可 以 使 用 + 运算 符 。 举 例 来 说 ， 字符 串 A + 字符 
PB 并 不 表示 加 法 操作 ， 它 表 示 的 是 把 这 两 个 字符 串 连接 起 来 ， 生成 一 个 新 的 字符 串 。 关 键 
之 处 在 于 支持 + 运算 符 的 每 种 数据 类 型 ， 必须 告诉 Python, + 运算 符 应 该 如 何 去 工 作 。 这 
也 体现 了 重 载 概念 的 具体 应 用 。 
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虽然 我 们 不 能 让 一 个 数字 和 一 个 字符 串 相 加 ， 但 Python 确实 支持 不 同 的 数字 类 型 相 加 。 
当 一 个 整数 和 一 个 浮 点 数 相 加 时 ， 系统 会 决定 使 用 整数 加 法 还 是 浮 点 数 加 法 (实际 上 并 不 存在 
混合 运算 )。Python 使 用 数字 类 型 强制 转换 的 方法 来 解决 数字 类 型 不 一 致 的 问题 ， 也 就 是 说 它 
会 强制 将 一 个 操作 数 转 换 为 同 男 一 个 操作 数 相同 的 数据 类 型 。 这 种 操作 不 是 随意 进行 的 ， 它 遵 
循 以 下 基本 规则 。 









































首先 ， 如 果 两 个 操作 数 都 是 同一 种 数据 类 型 ， 没 有 必要 进行 类 型 转换 。 仅 当 两 个 操作 数 类 
型 不 一 致 时 ， Python 才 会 去 检查 一 个 操作 数 是 否 可 以 转换 为 妨 一 类 型 的 操作 数 。 如 果 可 以 ， 
转换 它 并 返回 转换 结果 。 由 于 某 些 转换 是 不 可 能 的 ， 比 如 果 将 一 个 复数 转换 为 非 复 数 类 型 ， 将 
一 个 浮 点 数 转换 为 整数 等 等 ， 因 此 转换 过 程 必须 遵守 几 个 规则 。 














要 将 一 个 整数 转换 为 浮 点 数 ， 只 要 在 整数 后 面 加 个 .0 就 可 以 了 。 要 将 一 个 非 复数 转换 为 
复数 ， 则 只 需要 要 加 上 一 个 “Oj” 的 虚数 部 分 。 这 些 类 型 转换 的 基本 原则 是 : 整数 转换 为 浮 
点 数 ， 非 复数 转换 为 复数 。 在 Python 语言 参考 中 这 样 描 述 coerce () 方法 : 
如 果 有 一 个 操作 数 是 复数 ， 为 一 个 操作 数 被 转换 为 复数 。 E 





























否则 ， 如 果 有 一 个 操作 数 是 浮 点 数 ， 男 一 个 操作 数 被 转换 为 浮 点 数 。 
否则 ， 如 果 有 一 个 操作 数 是 长 整数 ， 则 另 一 个 操作 数 被 转换 为 长 整数 ; 
否则 ， 两 者 必然 都 是 普通 整数 ， 无 须 类 型 转换 。( 参 见 下 文中 的 示意 图 ) 





t 


图 5 一 1 的 流程 图 曾 释 了 强制 转换 的 规则 。 数 字 类 型 之 间 的 转换 是 自动 进行 的 , 程序 员 无 须 
自己 编码 处 理 类 型 转换 。 不 过 在 确实 需要 明确 指定 对 茶 种 数据 类 型 进行 特殊 类 型 转换 的 场合 ， 
Python 提供 了 coerce) 内 建 函 数 来 帮助 你 实现 这 种 转换 。( 见 5. 6. 2 小 节 ) 












































dim 
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START with 
both numbers 












| 
| 
No No Either No | 
| long int? | 
| | 
| | 
| | 
| Yes Yes Yes | 
| | 
| | 
| Both N No Both \_ No Both \_ No | 
| complex? float? long int? | 
| | 
| | 
| | 
| Yes Yes Yes 
| 
| 
Convert Convert Convert | 
| non-complex non-float non-long | 
| to complex to float to long | 
| 
| 
人 


Perform the desired numeric computation and STOP 


DGD D — ee m — UD — ED ED AN ED ED ED UD UD ED ED ED ED UD ED a am S 


图 5-1 数值 类 型 转换 


下 面 演示 一 下 Python 的 自动 数据 类 型 转换 。 为 了 让 一 个 整数 和 一 个 浮 点 数 相 加 ， 必须 使 
二 者 转换 为 同一 类 型 。 因 为 浮 点 数 是 超 集 ， 所 以 在 运算 开始 之 前 ， 整数 必须 强制 转换 为 一 个 浮 
点 数 ， 运 算 结果 也 是 浮 点 数 ; 


D> 1+ 4.5 
3. I 


e+- 
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5.5.2 ”标准 类 型 运算 符 


第 四 章 中 讲 到 的 标准 运算 符 都 可 以 用 于 数值 类 型 。 上 文中 提 到 的 混合 模式 运算 问题 ， 也 就 
是 不 同 数据 类 型 之 间 的 运算 ， 在 运算 之 前 , Python 内 部 会 将 两 个 操作 数 转换 为 同一 数据 类 型 。 

下 面 是 一 些 数字 标准 运算 的 例子 : 

2225.2 == 5.2 

True 

222 -719 d= 833 

False 

222 b44e = 2-3e 

True 

DDS 26569 # same as (265) and(5«9) 

True 

2» 77 > 66 == 66 # same as ( 77 > 66 ) and ( 66 == 66 ) 

True 

2220 < -90.4 < 55. 8e2 /= 8 < 181 

False 

SD» (-1 < D or A < -D 

True 


5.5.3 ”算术 运算 符 


Python 支持 单 目 运算 符 正 号 (+) MAS (一)， WHH, +t, —, x, /, %, Xon, 
分 别 表 示 加 法 ， 减 法 ， FEA, 除法 ， RE, ARIE. M Python2. 2 起 ， 还 增加 了 一 种 新 
的 整除 运算 符 // 。 





























除法 

拥有 C 背景 的 程序 员 一 定 熟悉 传统 除法 一 一 也 就 是 说 ， 对 整数 操作 数 ， 会 执行 “地 板 除 ” 
(floor,， 取 比 商 小 的 最 大 整数 。 例如 5 除 以 2 等 于 2.5， 其 中 “2” 就 称 为 商 的 “地 板 ”， 即 “地 
板 除 ”的 结果 。 本 书 中 使 用 “地 板 除 ”的 说 法 是 为 了 沿用 原作 者 的 风格 ， 译 者 注 )。 对 浮 点 操作 
数 会 执行 真正 的 除法 。 然 而 ， 对 第 一 次 学 编程 的 人 或 者 那些 依赖 精确 计算 的 人 来 说 ， 可 能 就 需 
要 多 次 调整 代码 才能 得 到 自己 想 要 的 结果 。 

在 未 来 的 Python 版 本 中 ，Python 开发 小 组 已 经 决定 改变 / 运算 符 的 行为 。/ 的 行为 将 变 
更 为 真正 的 除法 ， 会 增加 一 种 新 的 运算 来 表示 地 板 除 。 下 面 我 们 总 结 一 下 Python 现在 的 除法 
规则 ， 以 及 未 来 的 除法 规则 : 
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dim 
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传统 除法 
如 果 是 整数 除法 ， 传统 除法 会 舍 去 小 数 部 分 ， 返 回 一 个 整数 (地 板 除 )。 如 果 操 作 数 之 一 
是 浮 点 数 , 则 执行 真正 的 除法 。 包 括 Python 语言 在 内 的 很 多 语言 都 是 这 种 行为 ,看 下 面 的 例子 : 














> 1/2 #perform integer result (floor) # MRR 


Ü 

2> 1.0/2.0 # returns actual quotient E IEEE 
0.5 

真正 的 除法 














除法 运算 总 是 返回 真实 的 商 ， 不 管 操作 数 是 整数 还 是 浮 点 数 。 在 未 来 版 本 的 Python 中 ， 
这 将 是 除法 运算 的 标准 行为 。 现 阶段 通过 执行 from — future import division 指令 ， 也 
可 以 做 到 这 一 点 。 








222 from _ future import division 
225 
2^ 1 / 2 # returns real quotient 
0. 5 
> 1.0/2.0 # returns real quotient 
0. 5 


地 板 除 

M Python 2. 2 开始 ， 一 个 新 的 运算 符 // 已 经 被 增加 进来 ， 以 执行 地 板 除 : // 除法 不 
管 操作 数 何 种 数值 类 型 ， 总 是 舍 去 小 数 部 分 ， 返回 数学 序列 中 比 真 正 的 商 小 的 最 接近 的 数字 。 

> 1// 2 # floors result, returns integer # HERR, 18 PIZ% 

















0 

> 1.0 // 2.0 # floors result, returns float # HOR, BEF AR 

0.0 

2» -1 // 2 # move left on number line# BAK -O5)\HEBK thee 一 7 
-7 


dim 
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关于 除法 运算 的 变更 ， 支持 的 人 和 反对 的 人 几乎 一 样 多 。 有 些 人 认为 这 种 变化 是 错误 的 ， 
有 些 人 则 不 想 修 改 自 己 的 现 有 代码 ， 而 剩 下 的 人 则 想 要 真正 的 除法 。 














之 所 以 会 有 这 种 变化 是 因为 Python 的 核心 开发 团队 认为 Python 的 除法 运算 从 一 开始 就 设 
计 失 误 。 特 别 是 ， 随 着 Python 的 逐渐 发 展 ， 它 已 经 成 为 那些 从 未 接触 过 地 板 除 的 人 们 的 首选 
学 习 语言 。Python 语言 的 发 明 人 范 * 罗 萨 姆 在 他 的 《Python 2. 2 新 增 功能 》 一 文中 讲 到 : 











def velocity(distance, totalTime): 
rate = distance / totalTime 























你 可 能 会 说 ， 只 要 有 一 个 参数 为 浮 点 数 这 个 函数 就 能 正常 工作 。 像 上 面 提 到 的 那样 ， 要 确 
保 它 能 正常 工作 需要 强制 将 参数 转换 为 浮 点 类 型 ， 也 就 是 rate = float(distance) / 
float (totalTime) 。 将 来 除法 将 变更 为 真正 的 除法 ， 上 面 的 代码 可 以 无 需 更 改正 常 工作 。 需 要 
地 板 除 的 地 方 只 需要 改变 为 两 个 连续 的 除 号 。 
























































以 确保 它 能 适应 新 的 除法 行为 。 而 且 对 那些 强烈 需要 某 种 除法 行为 的 人 来 说 ， Python 解释 器 
提供 了 Qdivision style 启动 参数 。 一 Qnew 执行 新 的 除法 行为 ， -Qold 则 执行 传统 除法 行 
为 (默认 为 Qo1d)。 你 也 可 以 帮助 你 的 用 户 使 用 -Qwarn 或 -Qwarnall 参数 度 过 过 渡 时 期 。 














是 的 ， 代码 会 受到 一 些 影响 ， Python 团队 已 经 创作 了 一 系列 脚本 帮助 你 转换 旧 代 码 ， 








关于 这 次 变化 的 详细 信息 可 以 参考 PEP238。 如 果 你 对 这 场 论战 感 兴趣 ， 也 可 以 翻阅 2001 
年 的 comp. lang. python 归档 。 3€ 5.2 总结 了 除法 运算 符 在 不 同 Python 版 本 中 的 行为 差异 。 











取 余 
整数 取 余 相 当 容 易 理 解 ， 浮 点 数 取 余 就 略 复杂 些 。 








表 5.2 除法 操作 符 的 行为 


dim 
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Table 5.2 Division Operator Functionality 


2.9 and Newer 





2.2 and Newer (Import of 
Operator 2.1.x and Older (No Import) division) 
/ classic classic true 


/ / n/a floor floor 


商 取 小 于 等 于 精确 值 的 最 大 整数 的 乘积 之 差 ， BU: x- (math. floor (x/y) * y) 或 者 


对 于 复数 , 取 余 的 定义 类 似 于 浮 点 数 , 不 同 之 处 在 于 商 仅 取 其 实数 部 分 , 即 : 
x — (math.floor((x/y).real) * y). 


Tos 





窜 运 算 操作 符 和 一 元 操作 符 之 间 的 优先 级 关系 比较 特别 : XS ERE FF EGRE I UHR TE BL 
的 一 元 操作 符 优先 级 低 , 比 

起 右 侧 操作 数 的 一 元 操作 符 的 优先 级 高 , 由 于 这 个 特性 你 会 在 算术 运算 符 表 中 找到 两 个 
tx. 下面 举 几 个 例子 : 








MO x2 

9 

> -3 x 2 # ek WER d A Mg - 

-9 

Mo C3) **2 # WHE SHER PIEK 
9 

220 4.0 3 -1. 0 e TEZEZRICT AW - 
0. 25 


第 2 种 情况 下 解释 器 先 计算 3#*#2 再 取 其 相反 数 , 我 们 需要 给 -3” 加 上 括号 来 得 到 我 们 希 
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望 的 结果 。 最 后 一 个 例子 ， 结 果 是 4## (-1), 这 是 按照 规定 的 优先 级 获得 的 结果 . 
A25 4 xx -] 
Traceback (innermost last): 
File "Xstdin^/^, line l, in ? 
ValueError: integer to the negative power 





总 结 








5.3 总 结 了 所 有 的 算术 运算 符 ， 从 上 到 下 ， 计算 优先 级 依次 降低 。 这 里 列 出 的 所 有 


表 
运算 符 都 比 即 将 在 5. 5. 4 小 节 讲 到 的 位 运算 符 优先 级 高 。 
表 5.3 算术 运算 符 


算术 去 处 符 功能 
Xu Xx AR 
+expr 结果 符号 不 变 
-expr 对 结果 符号 取 负 


XU uxo BF 
expri * expr2 表达 式 1 乘 表达 式 2 
exprl / expr2 KAII RU id rl2 feAERBER LEE) 
exprl // expr2 Xu MRIRU ZI 
exprl % expr2 KAI *xuxx2 A 
exprl + expr2 KAI 加 KAIZ 
expri - expr2 KICI A KIIL 
注 : ** 运算 符 优 先 级 高 于 单 目 运算 符 





下 面 是 更 多 Python 数值 运算 的 例子 : 


D>» -442 - 77 
-519 
222 





+- > 
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dim 
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2200 4 # 3 
64 
222 
200 42 #& 3.2 
98. 7183139527 
D> 8/8 
2 
>> 8.0 / 8.0 
2. 66666666667 
D> 8% 8 
2 
Por (60. - 32.) * Ca ZB J 
15. 5555555556 
>>> 14 * 0x04 
56 
225 0170 / 4 
30 
>>> 0x60 + 0777 
639 
222 4bL * 221 
990L 
222 16399L + OxA94ESL 
709879L 
22^ —-2147483648L — 52147483648L 
542949672 96L 
>> 64. 875417 + 4. 23-8. 5j 
(68. 605-7. 5j) 
> O17 ** 2 # same as 0* (1 j**2) 
(-1*07) 
>> Ij ** 2 # same as 1+ (1 j#*2) 
07 
2200 (Ij) xx 2 
2j 





注意 指数 运算 符 的 优先 级 高 于 连接 实 部 和 虚 部 的 + 号 运算 符 。 就 上 面 最 后 一 个 例子 来 说 ， 我 
们 人 为 的 加 上 了 括号 ， 这 就 改变 运算 顺序 ， 从 而 得 到 我 们 想 要 的 结果 。 


5. 5.4 ”* 位 运算 符 ( 只 适用 于 整数 ) 
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Python 整数 支持 标准 位 运算 : BU C). ， 按 位 B®, 或 (|) 及 ERC ARAUEGORUR 
移 (2>) Python 这 样 处 理 位 运算 : 

e 负数 会 被 当成 正 数 的 2 进 制 补 码 处 理 。 

e 左 移 和 右 移 N 位 等 同 于 无 溢出 检查 的 2 的 N ieee: 2*N. 

e 对 长 整数 来 说 ， 位 运算 符 使 用 一 种 经 修改 的 2 进 制 补 码 形式 ， 使 得 符号 位 可 以 无 限 的 

向 左 扩展 。 

取 反 ( ) 运 算 的 优先 级 与 数字 单 目 运算 符 相 同 ， 是 所 有 位 操作 符 中 优先 级 最 高 的 一 个 。 I 
移 和 右 移 运算 的 优先 级 次 之 ,但 低 于 加 减法 运算 。 与， 或 ， 异 或 运算 优先 级 最 低 。 所 有 位 运 
算 符 按 优 先 级 高 低 列 在 表 5.4 中 。 












































表 5.4 ” 整 型 位 运算 符 
EIF hE 


~num 单 目 运算 ， 对 数 的 每 一 位 取 反 。 结 果 为 
numl «« num2 Numi A num2 位 

numi >> num2 Numi f£ num2 f£ 

numi & num2 numl 5 num2 h 与 

numi ^ num2 numi Æ num2 

numl | num2 numi 与 num2 í 或 





下 面 是 几 个 使 用 整数 30 (011110)，45(101101) ，60 (111100) 进行 位 运算 的 例子 : 


225 30 & 45 
12 


dim 
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2» 30 | 45 
22^ 45 & 60 


2» 45 | 60 


~, 


2^ 30 


M 


2M 45 
2202 45 KK I 
2 60 > 2 


2 30 ^45 


5.6 内 建 函数 与 工厂 函数 
5. 6.1 标准 类 型 函数 


在 上 一 章 中 ， 我 们 介绍 了 cmpQ, strO 和 typeO 内 建 函 数 。 这 些 函 数 可 以 用 于 所 有 
的 标准 类 型 。 对 数字 对 象 来 说 ， 这 些 函 数 分 别 比 较 两 个 数 的 大 小 ， 将 数字 转换 为 字符 串 ， 以 
及 返回 数字 对 象 的 类 型 。 

22^ emp(-6, 2) 

=f 

22^ emp (-4. 333333, -2. 718281828) 

=f 

2» emp (OxFF, 255) 

Ü 

22 str (OxFF) 

255° 

222 str (55. 3e2) 

' 5530. 0' 

225 type (OxFF) 

«type int’? 

>> type (987654321098 765432 10L) 








e+ 








-*- - 
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«type ’ long’ > 
2> type(Z-1j) 
<type complex’ > 


5.6.2 ”数字 类 型 函数 


Python 现在 拥有 一 系列 针对 数字 类 型 的 内 建 函 数 。 一 些 函数 用 于 数字 类 型 转换 ， 男 一 些 
则 执行 一 些 常用 运算 。 





转换 工厂 函数 


函数 int), longO, float( 和 complexQ 用 来 将 其 它 数值 类 型 转换 为 相应 的 数值 类 型 。 


从 Python 1.5 版 本 开始 ， 这 些 函 数 也 接受 字符 串 参 数 ， 返回 字符 串 所 表示 的 数值 。 从 Python 
1.6 版 开始 ，int 0 和 longO 在 转换 字符 串 时 ， 接 受 一 个 进 制 参数 。 如 果 是 数字 类 型 之 间 的 
转换 ， 则 这 个 进 制 参数 不 能 使 用 。 








从 Python2.2 起 ， 有 了 第 五 个 内 建 函 数 bool () 。 它 用 来 将 整数 值 1 和 0 转换 为 标准 布尔 
值 True 和 False. 从 Python2. 3 开始 ， Python 的 标准 数据 类 型 添加 了 一 个 新 成 员 : 布尔 
(Boolean) 类 型 。 从 此 true 和 false 现在 有 了 常量 值 即 True 和 False( 不 再 是 1 和 0) 。 
要 了 解 布尔 类 型 的 更 多 信息 ， 参阅 5. 7. 1 小 节 。 











另外 ， 由 于 Python 2. 2 对 类 型 和 类 进行 了 整合 (这 里 指 Python 的 传统 风格 类 和 新 风格 类 
一 一 译 者 注 )， 所 有 这 些 内 建 函 数 现在 都 转变 为 工矿 函数 。 我 们 曾经 在 第 四 章 介 绍 过 工厂 函数 ， 
所 谓 工 厂 函 数 就 是 指 这 些 内 建 函 数 都 是 类 对 象 ， 当 你 调用 它们 时 , 实际 上 是 创建 了 一 个 类 实例 。 

















不 过 不 用 担心 ， 这 些 函 数 的 使 用 方法 并 没有 什么 改变 。 
下 面 是 一 些 使 用 内 建 函 数 的 示例 : 
222 int (4. 25555) 

4 

2» long (42) 

42L 

2> float (4) 

4.0 

22» complex (4) 

(440 j) 

222 
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> Bi 





1 


dim 
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22^ complex (2. 4, -8) 

(2. 4-8 j) 

222 

2^ complex (2. 8e-10, 45. 3e4) 
(2. 3e-10*453000 j) 


表 5.5 数值 工厂 函数 总 结 

类 (工厂 函数 ) 操作 

bool (obj) P 返回 obj 对 象 的 布尔 值 ， 也 就 是 
obj. nonzero__() 方 法 的 返回 值 

int (obj, base=10) 返回 一 个 字符 串 或 数值 对 象 的 整数 表 
示 ， 类 似 string.atoi(); 从 Python 1.6 起 ， 
引入 了 可 选 的 进 制 参数 。 

long (obj, base-10) ”返回 一 个 字符 或 数据 对 象 的 长 整数 表 
示 ， 类 似 string.atol()， 从 Python1.6 起 ， 
引入 了 可 选 的 进 制 参数 

float (obj) 返回 一 个 字符 串 或 数据 对 象 的 浮 点 数 


表示 ， 类 似 string.atof() 








complex(str) or 
complex (real, imag-0.0) 返回 一 个 字符 串 的 复数 表示 ， 或 
者 根据 给 定 的 实数 〈 及 一 个 可 选 
的 虚数 部 分 ) 生 成 一 个 复数 对 象 。 


a. 在 Python2.3 之 前 ， 这 些 都 是 内 建国 数 
b. Python2. 2 中 新 增 的 内 建 函 数 ， 在 Python2. 3 中 改变 为 工厂 函数 








功能 函数 
Python 有 五 个 运算 内 建 函 数 用 于 数值 运算 : abs()，coerce()，divmod()，pow()，pow( 
和 round() 。 我 们 将 对 这 些 函数 逐一 浏览 ， 并 给 出 一 些 有 用 的 例子 : 


4 . 
$— —$— 一 人 | $ 
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mk 





abs (返回 给 定 参 数 的 绝对 值 。 如 果 参 数 是 一 个 复数 ， 那 么 就 返回 math. sqrt (num. real2 + 
num. imag2) 。 下 面 是 几 个 abs 0 函数 的 示例 : 

2» abs (-1) 

7 

22^ abs (10. ) 

10. 0 

2» abs (1. 2-2. 1j) 

2. 41867732449 

> abs (0.23 - 0. 78) 

0. 55 





函数 coerce ()， 尺 管 从 技术 上 讲 它 是 一 个 数据 类 型 转换 函数 ， 不 过 它 的 行为 更 像 一 个 运算 
符 ， 因 此 我 将 它 放 到 了 这 一 小 节 。 在 5.5.1 小 节 ， 我 们 讨论 了 Python 如 何 执 行 数值 类 型 转换 。 
函数 coerce O 为 程序 员 提供 了 不 依赖 Python 解释 器 ， 而 是 自 定义 两 个 数值 类 型 转换 的 方法 。 

对 一 种 新 创建 的 数值 类 型 来 说 ， 这 个 特性 非常 有 用 。 函 数 coerce 0 仅 回 一 个 包含 类 型 转换 完 


毕 的 两 个 数值 元 素 的 元 组 。 下 面 是 几 个 例子 : 














>»» coerce(1, 2) 
Gy 2) 

222 

222 coerce(1.3, 134L) 
(1.3, 134. 0) 
225 
222 coerce(1, 134L) 
(IL, 134L) 
2252 
22» coerce (1j, l134L) 
Gj, (34:05) 

222 

22» coerce (1. 23-41j, 1341) 
(1. 23-41j), (134+0j)) 








divmod O 内 建 函 数 把 除法 和 取 余 运算 结合 起 来 ， 返 回 一 个 包含 商 和 余数 的 元 组 。 对 整数 来 
说 ， 它 的 返回 值 就 是 地 板 除 和 取 余 操作 的 结果 。 对 浮 点 数 来 说 ， 返回 的 商 部 分 是 
math. floor(numl/num2), ， 对 复数 来 说 ， 商 部 分 是 ath. floor((numl/num2). real). 

222 divmod (10, 3) 


(3, D 
222 divmod (3, 10) 


4 . 
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(0 3) 

222 divmod(10, 2. 5) 

(4.0, 0.0) 

222 divmod (2. 5, 10) 

(0.0, 2.5) 

22» divmod(2^1j, 0.5-1j) 
(0j (Lp) 








函数 pow) 和 双星 号 Crk) 运算 符 都 可 以 进行 指数 运算 。 不 过 二 者 的 区 别 并 不 仅仅 在 于 











个 是 运算 符 ， 一 个 是 内 建 函数 。 








TE Python 1.5 之前， 并 没有 ** 运算 符 。 内 建 函数 pow) 还 接受 第 三 个 可 选 的 参数 ， 一 个 
余数 参数 。 如 果 有 这 个 参数 的 ， pow() 先进 行 指数 运算 ， 然 后 将 运算 结果 和 第 三 个 参数 进行 取 
余 运算 。 这 个 特性 主要 用 于 密码 运算 ， 并 且 比 pow(x, y) % z 性 能 更 好 ， 这 是 因为 这 个 函数 的 





实现 类 似 于 C 函数 pow(x, y, z). 


2225 pow (2, 5) 
32 

222 

22» pow (5, 2) 

25 

22» pow (3. 141592, 2) 
9. 86960029446 
222 
2» pow(1*l1j, 3) 
(-242 j) 


内 建 函数 round O 用 于 对 浮 点 数 进行 四 售 五 入 运算 。 它 有 一 个 可 选 的 小 数位 数 参 数 。 如 果 














不 提供 小 数位 参数 ， 它 返回 与 第 一 个 参数 最 接近 的 整数 《但 仍然 是 浮 点 类 型 )。 





诉 round 函数 将 结果 精确 到 小 数 点 后 指定 位 数 。 
222 round (3) 
3.0 
2» round (3. 45) 
3.0 
>>> round (3. 4999999) 
3.0 
>> round (3. 4999999, 1) 
3.5 
>>> import math 
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—^4^ 25 








dim 
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22» for eachNum in range (10): 
print round (math. pi, eachNum) 

3. 0 

3.1 

3. 14 

3. 142 

3. 1416 

3. 14159 

3. 141593 

3. 1415927 

3. 14159265 

3. 141592654 

3. 1415926536 

2> round 3. 5) 

-4. 0 

2» round 3. 4) 

-3. 0 

222 round (-3. 49) 
9.0 
222 round(-3. 49, 1) 
rh ars} 


值得 注意 的 是 round() 函数 是 按 四 人 钨 五 入 的 规则 进行 取 整 。 也 就 是 round (0. 5) 得 到 1, 


round(-0. 5) 得 到 一 1。 独 一 看 int), round(), math. floor O 这 几 个 函数 好 像 做 的 是 同一 件 








F, 很 容易 将 它们 弄 混 ， 是 不 是 ? 下 面 列 出 它们 之 间 的 不 同 之 处 : 

函数 int O 直接 截 去 小 数 部 分 。( 返 回 值 为 整数 ) 

函数 floor O 得 到 最 接近 原 数 但 小 于 原 数 的 整数 。( 返 回 值 为 浮 点 数 ) 

函数 round O 得 到 最 接近 原 数 的 整数 。( 返 回 值 为 浮 点 数 ) 

的 例子 用 四 个 正 数 和 四 个 负数 作为 这 三 个 函数 的 参数 ， 将 返回 结果 列 在 一 起 做 个 比较 
(为 了 便于 比较 ， 我 们 将 int 0 函数 的 返回 值 也 转换 成 了 浮 点 数 )。 














22^ import math 
2M» for eachNum in (2 .7 LZ LZ -2 -7 -L2 -1. 7): 
. print “int (% 1£) \t%+. 1f^ % (eachNum, float (int (each- 
Num) )) 
. print “floor (%. 1f) \t%+. 1f^ % (eachNum, 








二 一 —o— — 


o 
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. math. floor (eachNum) ) 
. print “round (%. 1f) \t%+. 1f^ % (eachNum, round (eachNum) ) 
. print '-' * 20 


int (0.2) 40.0 
floor (0. 2) +0.0 
round (0. 2) +0. 0 





int (0. 7) +0.0 
floor (0. 7) +0.0 
round (0. 7) +1. 0 





int. 2) +1.0 
floor (1. 2) *1.0 
round (1. 2) +1.0 





int. 7) 41.0 
floor (1. 7) +1. 0 
round (1. 7) 42.0 





int (-0. 2) +0.0 
floor (-0. 2) -1.0 
round (-0, 2) +0.0 





int (-0. 7) *0.0 
floor (-0. 7) -1. 0 
round (-0. 7) -1.0 





int (-1. 2) -1.0 
floor(-1.2) -2.0 
round (-1. 2) -1.0 





int C1. 7) -1.0 
floor C1. 7) -2.0 
round 1. 7) -2.0 


45.6 数值 运算 函数 一 览 


表 5.6 数值 运算 内 建 函 数 





dim 
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abs (num) 返回 num 的 绝对 值 
coerce (numl, num2) 将 num1 和 num2 转 换 为 同一 类 型 ， 然 后 以 一 个 元 组 的 形式 
返回 。 


divmod(num1, num2) 除法 一 取 余 运算 的 结合 。 返 回 一 个 元 组 (num1/num2,num1 96 
num2)。 对 浮 点 数 和 复数 的 两 进行 下 舍 入 〈( 复 数 仅 取 实 





数 部 分 的 商 ) 
pow(numl, num2, mod-1) K numi Hý num2 KA, WHEE modZA(, Wit HAR 
HIJ mod HT RREH 
round (flt, ndig-0) 接受 一 个 浮 点 数 fit 并 对 其 四 舍 五 入 ， 保 存 ndig 位 小 数 。 
若 不 提供 ndig 参数 ， 则 默认 小 数 点 后 0 位 。 
* round() 仅 用 于 浮 点 数 。〔 译 者 注 : 整数 也 可 以 ， 不 过 并 没有 什么 + 


实际 意义 ) 


5. 6. 3 仅 用 于 整数 的 函数 
除了 适应 于 所 有 数值 类 型 的 内 建 函 数 之 外 ,Python 还 提供 一 些 仅 适用 于 整数 的 内 建 函 数 ( 标 
准 整数 和 长 整数 )。 这 些 函 数 分 为 两 类 ， 一 类 用 于 进 制 转换 ， 另 一 类 用 于 ASCII 转换 。 














进 制 转换 函数 

前 面 我 们 已 经 看 到 ， 除 了 十 进 制 标准 ，Python 整数 也 支持 八进制 和 16 进 制 整数 。 除 此 之 
Sb, Python 还 提供 了 两 个 内 建 函 数 来 返回 字符 串 表 示 的 8 进 制 和 16 进 制 整数 .它们 分 别 是 oct 0 
和 hex 0 。 它 们 都 接受 一 个 整数 〈 任 意 进 制 的 ) 对 象 ， 并 返回 一 个 对 应 值 的 字符 串 对 象 。 下 面 
是 几 个 示例 : 














2 hex (255) 
“OF 


© 
e 
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>>> hex (230948231) 
” 0x 1606627L’ 

222 hex (655352) 
’Oxl tf ffe’ 

»> 

2 oct (255) 
'0377 

222 oct (230948231) 
'0130063047L" 

222 oct (65535*2) 
'0377776* 


ASCII 转换 函数 


Python 也 提供 了 ASCIT (美国 标准 信息 交换 码 〉 码 与 其 序列 值 之 间 的 转换 函数 。 每 个 字符 
对 应 一 个 唯一 的 整数 (0 一 255)。 对 所 有 使 用 ASCII 表 的 计算 机 来 说 ， 这 个 数值 是 不 变 的 。 这 
保证 了 不 同系 统 之 间 程 序 行为 的 一 致 性 。 函数 chr (接受 一 个 单字 节 整 数值 , 返回 一 个 字符 串 ， 
其 值 为 对 应 的 字符 。 函 数 ord O 则 相反 ， 它 接受 一 个 字符 ， 返 回 其 对 应 的 整数 值 。 











222 ord( a’) 
97 
2> ord l A’) 
65 
2» ord( 0’) 
48 


2» chr (97) 
^a 3 

2» chr (65L) 
7A » 

2» chr (48) 

F 0’ 


425.7 列 出 了 用 于 整数 类 型 的 所 有 内 建 函 数 
表 5.7 仅 适 用 于 整数 的 内 建 函 数 











函数 操作 





dim 
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T 





hex (num) ”将 数字 转换 成 十 六 进 制 数 并 以 字符 串 形式 返回 
oct (num) ”将 数字 转换 成 八进制 数 并 以 字符 串 形式 返回 
chr (num) ”将 Ascll 值 的 数字 转换 成 AScll 字 符 ， 范 围 只 
能 是 0 <= num <= 255。 
ord(chr) ”接受 一 个 ASCII 或 Unicode 字符 (长 度 为 1 的 字符 串 〉) ， 返 回 相 应 的 Ascll 
或 Unicode 值 。 
unichr(num) ”接受 Unicode 码 值 , 返回 其 对 应 的 Unicode 字 符 。 所 接受 的 码 值 范围 依赖 于 
你 的 Python 是 构建 于 UCS-2 还 是 UCS-4。 














5.7 其 他 数字 类 型 


$ 5.7.1 布尔 “ 数 ” + 


从 Python2. 3 开始 ,布尔 类 型 添加 到 了 Python 中 来 ,尽管 布尔 值 看 上 去 是 “True” 和 “False， 
但 是 事实 上 是 整 型 的 子 类 ， 对 应 与 整数 的 1 和 0。 下 面 是 有 关 布 尔 类 型 的 主要 概念 : 











有 两 个 永 不 改变 的 值 True 或 False. 

布尔 型 是 整 型 的 子 类 ， 但 是 不 能 再 被 继承 而 生成 它 的 子 类 。 

Xt nonzero () 方法 的 对 象 的 默认 值 是 True。 

对 于 值 为 零 的 任何 数字 或 空 集 ( 空 列表 、 空 元 组 和 空 字典 等 ) 在 Python 中 的 布尔 值 都 
是 False. 

e 在 数学 运算 中 ，Boolean 值 的 True Fil False 分 别 对 应 于 1 和 0。 

@ dissi dcs EUM Qu A 

@ True fil False 现在 都 不 是 关键 字 ， 但 是 在 Python 将 来 的 版 本 中 会 





























所 有 Python 对 象 都 有 一 个 内 建 的 True I False 值 ， 对 内 建 类 型 来 说 ， 这 个 值 完 竟 是 True 
还 是 False 请 参阅 章节 4. 3. 2 中 的 核心 备注 。 下 面 是 使 用 内 建 类 型 布尔 值 的 一 些 例子 : 
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# intro 

22» bool (1) True 

>> bool (True) True 
2» bool(0) False 

2» bool( 1!) True 

2» bool C0’) True 

2» bool ([]) False 

> bool ( (1) ) True 


E REIHE 

222 foo = 42 

222 bar = foo < 100 

222 bar 

True 

222 print bar + 100 
101 

2» print °%s’ % bar 
True 

2» print °%d’ % bar 
1 


# 5 nonzero 0 
222 class C: pass 
M2e-2C€0 
225 
>>> bool (c) True 
>>> bool (C) True 


A ## nonzero ( EEP False 
2> class C: 

def nonzero (self): 

return False 


> c = CO 
222 bool (c) False 
222 bool (C) True 


# R, WEAF!!! CEIBAIfTANEEXA TI) 
>>> True, False = False, True 
222 bool (True) False 


© 
e 
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2» bool (False) True 


你 可 以 在 Python 文档 和 PEP 285 看 到 有 关 布 尔 类 型 的 知识 。 


5.7.2 和 十进制 浮 点 数 


从 Python2.4 起 (参阅 PEP327) 十 进 制 浮 点 制 成 为 一 个 Python 特性 。 这 主要 是 因为 下 面 
的 语句 经 常会 让 一 些 编写 科学 计算 或 金融 应 用 程序 的 程序 员 抓 狂 : 

> 0.1 

0. 1000000000000001 

为 什么 会 这 样 ? 这 是 因为 语言 绝 大 多 数 C 语言 的 双 精 度 实现 都 遵守 IEEE 754 规范 ， 其 中 
52 位 用 于 底 。 因 此 浮 点 值 只 能 有 52 位 精度 ， 类 似 这 样 的 值 的 二 进 制 表示 只 能 象 上 面 那 样 被 截 
Br. 0. 1 的 三 进 制 表示 是 0. 11001100110011 . 

因为 最 接近 的 二 进 制 表示 就 是 . 0001100110011... 2X 1/16 41/32 + 1/256 +. 

















你 可 以 看 到 ， 这 些 片 断 不 停 的 重复 直到 舍 入 出 错 。 如 果 我 们 使 用 十 进 制 来 做 同样 的 事情 ， 
感觉 就 会 好 很 多 ， 看 上 去 会 有 任意 的 精度 。 注 意 下 面 ， 你 不 能 混用 十 进 制 浮 点 数 和 普通 的 浮 点 
数 。 你 可 以 通过 字符 串 或 其 它 十 进 制 数 创建 十 进 制 数 浮 点 数 。 你 必须 导入 decimal 模块 以 便 
使 用 Decimal 类 ; 

222 from decimal import Decimal 

222 dec = Decimal (. 1) 

Traceback (most recent call last): File “<stdin>”, line l, in ? 
File “/usr/local/lib/python2, 4/decimal.py/, line 523, in new . 









































raise TypeError( Cannot convert float to Decimal. “+ 

TypeError: Cannot convert float to Decimal. First convert the float to 
a string 

2» dec = Decimal C. 1’) 

222 dec 


Decimal 0. 17) 

222^ print dec 

0.1 

222 dec + 1.0 

Traceback (most recent call last): File “<stdin>”, line l, in ? 
File “/usr/local/lib/python2, 4/decimal. py”, line 906, in | add . 
other = convert other (other) 

File “/usr/local/lib/python2, 4/decimal. py”, line 2863, in 
convert other 
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raise TypeError, “You can interact Decimal only with int, long or ` 

Decimal data types. ^ 

TypeError: You can interact Decimal only with int, long or Decimal data types. 
222 

2» dec + Decimal C1. 0’) Decimal (1. 17) 

2» print dec + Decimal ( 1. 0’) 

1.1 


你 可 以 从 Python 文档 中 读 取 相关 的 PEP 以 了 解 十 进 制 数 。 值 得 庆幸 的 是 ， 十 进 制 数 和 其 
它 数 值 类 型 一 样 ， 可 以 使 用 同样 的 算术 运算 符 。 由 于 十 进 制 数 本 质 上 是 一 种 用 于 数值 计算 的 特 











殊 类 ， 我 们 在 本 章 的 剩余 部 分 将 不 再 专门 讲解 十 进 制 数 。 


5.8 相关 模块 











在 Python 标准 库 中 有 不 少 专门 用 于 处 理 数 值 类 型 对 象 的 模块 , 它们 增强 并 扩展 了 内 建 函 数 
的 功能 和 数值 运算 的 功能 。 K 5. 8 列 出 了 几 个 比较 核心 的 模块 。 要 详细 了 解 这 些 模块 ， 请 参阅 











这 些 模块 的 文献 或 在 线 文 档 。 


对 高 级 的 数字 科学 计算 应 用 来 说 , 你 会 对 著名 的 第 三 方 包 Numeric(NumPy) 和 SciPy 感 兴 








趣 。 关 于 这 两 个 包 的 详细 请 访问 下 面 的 网 址 。 


http: //numeric. scipy. org/ 
http://scipy. org/ 


# 5.8 数字 类 型 相关 模块 





BK RA 

decimal 十 进 制 浮 点 运算 类 Decimal 

array 高 效 数值 数组 字符， 整数 ， 浮 点 数 等 等 ) 

math/cmath 标 准 C 库 数学 运算 函数 ,常规 数学 运算 在 match 模 块 ， 
复数 运算 在 cmath 模 块 


operator HKFGHATNKHRLHM. IYI tor.sub (m, n) EM 
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Fm-n 
random 多 种 伪 随 机 数 生成 器 


核心 模块 : random 

当 你 的 程序 需要 随机 数 功能 时 ,random 模块 就 能 派 上 用 场 。 该 模块 包含 多 个 伪 随 机 数 发 生 
器 ， 它 们 均 以 当前 的 时 间 玲 为 随机 数 种 子 。 这 样 只 要 载 入 这 个 模块 就 能 随时 开始 工作 。 下 面 列 
出 了 该 模块 中 最 常用 的 函数 : 

两 个 整数 参数 ， 返 回 二 者 之 间 的 随机 整数 

randrange () 它 接受 和 rage) HMR - HH BR, 随机 返回 
range ([start, ] stop[, step]) 结 果 的 一 项 

uniform 几乎 和 randint 0 一样 , 不 过 它 返 回 的 是 二 者 之 间 的 一 个 浮 点 数 (不 包括 范围 
ER). 

random () 类 似 uniform) 只 不 过 下 限 恒 等 于 0.0， 上 限 恒 等 于 1.0 

choice () 随机 返回 给 定 序列 〈 关 于 序列 ， 见 第 六 章 ) 的 一 个 元 素 





到 这 儿 ， 我 们 的 Python 数值 类 型 之 旅 就 该 结束 了 。 














K 5.9 总 结 了 数值 类 型 的 所 有 内 建 函 数 和 运算 符 。 
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运算 符 /内 建 函 数 描述 


abs () 
chr () 
coerce () 


complex () 


divmod () 
float () 
hex () 
int () 
long () 
oct() 
ord() 
pow () 


round () 


* xb 


// 


Edit By Vheavens 


Absolute value 
Character 
Numeric coercion 


Complex factory 
function 


Division/modulo 
Float factory function 
Hexadecimal string 
Int factory function 
Long factory function 
Octal string 

Ordinal 
Exponentiation 

Float rounding 
Exponentiation 

No change 

Negation 

Bit inversion 
Exponentiation 
Multiplication 
Classic or true division 
Floor division 


Modulo/remainder 


整 型 ”长 整 型 


浮 点 型 复数 “结果 


. . number* 
str 

. . tuple 

n . comple: 

. . tuple 

. ° float 
str 

. . int 

. . long 
str 

(str) int 

H . number 

. float 

. . number 

. E number 

. . number 
int/lor 

. . number 

. . number 

* . number 

. . number 

H . number 


Table 5.9 Operators and Built-in Functions for All Numeric Types 
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T (continued) i T 
Operator/ 
Built-in Description Int Long Float Complex Result? 
+ Addition e e . . number 
加 法 
= Subtraction e oœ . . number 
减法 
<< Bit left shift e e ints Lo 
位 左 移 
>> Bit right shift e e int/lo 
位 右 移 
& Bitwise AND e e int / le 
按 位 与 运算 
^ Bitwise XOR ° . int/io 
按 位 异 或 运算 
Bitwise OR ee int/lo 
按 位 或 运算 


a. ”结果 为 number 表示 可 以 为 所 有 四 种 数值 类 型 ， 可 能 与 操作 数 相同 
b. 与 单 目 运算 符 有 特殊 关系 ， 参 阅 5. 5. 3 小 节 和 表 5.2 
c. 单 目 运算 符 


5.9 练习 


本 章 的 练习 可 以 先 通过 应 用 程序 的 形式 实现 。 一 旦 功能 齐备 并 且 调 试 通过 ， 建议 读者 将 自 
己 的 代码 功能 用 函数 封装 起 来 ， 以 便 在 后 面 的 练习 中 重用 代码 。 关 于 编程 风格 我 在 这 儿 提醒 一 
下 ， 最 好 不 要 在 函数 内 使 用 print 语句 输出 信息 ， 而 是 通过 return 语句 返回 必要 的 值 。 这 
样 调用 函数 的 代码 就 可 以 自己 处 理 显示 方式 。 这 样 你 的 代码 就 适应 性 更 广 ， 更 便于 重用 。 
























































. 
* 
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5-1 整形 讲 讲 Python 普通 整 型 和 长 整 型 的 区 别 
5-2 运算 符 
(a) 写 一 个 函数 ， 计 算 并 返回 两 个 数 的 乘积 
(b 写 一 段 代码 调用 这 个 函数 ， 并 显示 它 的 结果 
5-3 标准 类 型 运算 符 ， 写 一 段 脚本 ， 输 入 一 个 测验 成 绩 ， 根 据 下 面 的 标准 ， 输 出 他 的 评分 
成 绩 (A-F). 
: 90- 100 
80 - 89 
70 - 79 
60 - 69 
«60 





"n XD C» UO ou 


5-4 取 余 。 判 断 给 定年 份 是 否 是 闵 年 。 使 用 下 面 的 公式 : 

一 个 半年 就 是 指 它 可 以 被 4 整除 ,但 不 能 被 100 整除 ， 或 者 它 既 可 以 被 4 又 可 以 被 100 整 
除 。 比 如 1992, 1996 和 2000 年 是 半年 ， 但 1967 和 1900 则 不 是 半年 。 下 一 个 是 半年 的 整 世 
纪 是 2400 年 。 

5-5 取 余 。 取 一 个 任意 小 于 1 美元 的 金额 ， 然 后 计算 可 以 换 成 最 少 多 少 枚 硬币 。 硬 币 有 1 
美 分 ，5 美 分 ，10 美 分 ，25 美 分 四 种 。1 美元 等 于 100 美 分 。 举 例 来 说 ，0. 76 美元 换算 结果 
应 该 是 3 枚 25 美 分 D 枚 1 美 分 。 类 似 76 枚 1 美 分 ，2 枚 25 美 分 +2 ME 10 美 分 +1 枚 5 美 分 +l 
枚 1 美 分 这 样 的 结果 都 是 不 符合 要 求 的 。 

5-6 算术 。 写 一 个 计算 器 程序 你 的 代码 可 以 接受 这 样 的 表达 式 ,两 个 操作 数 加 一 个 运算 符 : 
NI 运算 符 N2. 其 中 NI 和 N2 为 整数 或 浮 点 数 ， 运 算 符 可 以 是 +，-，*¥，/，%，** 分 别 表示 
加 法 , 减法 ， 乘法 ， 整数 除 ， 取 余 和 究 运 算 。 计 算 这 个 表达 式 的 结果 ， 然 后 显示 出 来 。 提 示 : 
可 以 使 用 字符 串 方 法 split 0 〇 ,但 不 可 以 使 用 内 建 函 数 eval 0. 

5-7 营业 税 。 随 意 取 一 个 商品 金额 ， 然 后 根据 当地 营业 税额 度 计算 应 该 交纳 的 营业 税 。 


















































5-8 几何 。 计 算 面 积 和 体积 : 
(a) ”正方形 和 立方 体 
(b) 和 球 
5-9. ”数值 形式 回答 下 面 关 于 数值 格式 的 问题 : 
(a) 为 什么 下 面 的 例子 里 17+32 等 于 49， 而 017+32 等 于 47， 017+032 等 于 41? 
MO 17 + 32 


e+ 





-*- - 
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PPD OLF + 32 
47 

>>> OIT + 032 
4] 





Cb) 为 什么 下 面 这 个 表达 式 我 们 得 到 的 结果 是 134L 而 不 是 1342 ? 
2» 561 + 781 
134L 





5-10 转换 。 写 一 对 函数 来 进行 华氏 度 到 摄氏 度 的 转换 。 转 换 公式 为 C= (F - 32) * (5 / 9) 
应 该 在 这 个 练习 中 使 用 真正 的 除法 ， 否则 你 会 得 到 不 正确 的 结果 。 




















5-11 取 余 。 
(a) 使 用 循环 和 算术 运算 ， 求 出 0 一 20 之 间 的 所 有 偶数 
(b) 同上 ， 不 过 这 次 输出 所 有 的 奇数 
H (c) 综合 (a) 和 (b), 请 问 辨别 奇数 和 偶数 的 最 简单 的 方法 是 什么 ? 








(d) 使 用 (c) 的 成 果 ， 写 一 个 函数 ， 检 测 一 个 整数 能 否 被 另 一 个 整数 整除 。 先 要求 用 户 输 
入 两 个 数 ， 然 后 你 的 函数 判断 两 者 是 否 有 整除 关系 ， 根 据 判 断 结果 分 别 返 回 True 和 False; 








5-12 系统 限制 。 写 一 段 脚本 确认 一 下 你 的 Python 所 能 处 理 的 整数 ， 长 整数 ， 浮 点 数 和 复 
数 的 范围 。 








5-13 转换 。 写 一 个 函数 把 由 小 时 和 分 钟表 示 的 时 间 转 换 为 只 用 分 钟表 示 的 时 间 。 








5-14 银行 利息 。 写 一 个 函数 ， 以 定期 存 球 利率 为 参数 ， 假定 该 账户 每 日 计算 复 利 ， 请 计 
算 并 返回 年 回报 率 。 





5-15. ”最 大 公约 数 和 最 小 公 倍数 。 请 计算 两 个 整数 的 最 大 公约 数 和 最 小 公 倍数 。 








5-16 家 庭 财务 。 给 定 一 个 初始 金额 和 月 开销 数 ， 使 用 循环 ， 确 定 剩 下 的 金额 和 当月 的 文 
出 数 ， 包括 最 后 的 支出 数 。 PaymentO 函数 会 用 到 初始 金额 和 月 额度 ， 输出 结果 应 该 类 似 下 
面 的 格式 “例子 中 的 数字 仅 用 于 演示 ): 

Enter opening balance:100. 00 
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dim 
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Enter monthly payment: 16.13 
Amount Remaining 





Pymt# Paid Balance 
0 $ 0. 00 $100. 00 
1 $16. 13 $ 83.87 
2 $16. 13 $ 67.74 
3 $16. 13 $ 51.61 
4 $16. 13 $ 35.48 
5 $16. 13 $ 19.35 
6 $16. 13 $ 3.22 

T $ 3.22 $ 0.00 








5-17 随机 数 。 熟 读 随机 数 模 块 然后 解 下 面 的 题 : 

生成 一 个 有 N 个 元 素 的 由 随机 数 n 组 成 的 列表 ， 其 中 N 和 n 的 取 值 范围 分 别 为 : A< 
N <= 100), (0 <= n 《= 231 -D. 。 然 后 再 随机 从 这 个 列表 中 取 N (1 € N <= 100) 个 随机 数 
出 来 ， 对 它们 排序 ， 然 后 显示 这 个 子 集 。 


dim 
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e 字符 串 
e 列表 
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os 
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Chapter 











偏 移 量 访问 到 它 的 一 个 或 者 几 个 成 员 , 这 类 Py thon 类 型 统称 为 序列 , 包括 下 面 这 些 : 字符 串 ( 普 


接 下 来 我 们 要 研究 这 样 一 些 Python 的 类 型 ， 它 们 的 成 员 有 序 排 列 的 ， 并 且 可 以 通过 下 标 
* 
通 字符 串 和 unicode 字符 串 ) ， 列 表 ， 和 元 组 类 型 。 











因为 这 些 类 型 其 实 都 是 由 一 些 成 员 共 同 组 成 的 一 个 序列 整体 , 所 以 我 们 把 它们 统称 为 序列 ， 
比如 说 ， 一 个 字符 串 是 由 一 些 字符 (尽管 Python 并 没有 显 式 的 定义 字符 这 个 类 型 ) 组 成 的 序列 ， 
那么 “Hello” 这 个 字符 串 的 第 一 个 字符 就 是 “H ， 第 二 个 字符 就 是 “e”…… , 同样 的 ， 列 表 类 
型 和 元 组 类 型 就 是 其 他 一 些 Python 对 象 所 组 成 的 序列 。 















































首先 我 们 来 熟悉 一 下 适用 于 所 有 序列 类 型 的 操作 符 和 内 建 函 数 BIFs)， 
简介 
操作 符 
内 建 函 数 ( 如 果 可 用 ) 
特性 (如 果 可 用 ) 
相关 模块 (如果 可 用 ) 














在 本 章 的 末尾 我 们 会 给 出 一 个 对 于 所 有 序列 类 型 都 适用 的 操作 符 和 函数 的 参考 图 表 ， 现 





e 
+- > e. 
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在 让 我 们 概略 看 一 下 这 些 内 容 . 


0 1 2 N-2 N-1 
Sequence Li [ [] e.o [ [ 
-N — -N-1) -(N-2) -2 -1 


N == 序列 的 长 度 == len (sequence) 
Figure 6-1 有 多 少 可 以 保存 并 可 以 被 访问 的 序列 元 素 


6.1 序列 

序列 类 型 有 着 相同 的 访问 模式 ， 它 的 每 一 个 元 素 可 以 通过 指定 一 个 偏 移 量 的 方式 得 到 。 而 
多 个 元 素 可 以 通过 切片 操作 的 方式 一 次 得 到 ， 切 片 操 作 会 在 接 下 来 的 内 容 中 讲 到 。 下 标 偏 移 量 
是 从 0 开始 到 总 元 素数 -1 结束 -- 之 所 以 要 减 一 是 因为 我 们 是 从 0 开始 计数 的 。 图 6-1 阐述 
了 序列 的 元 素 是 如 何 存储 的 。 


6. 1.1 标准 类 型 操作 符 
标准 类 型 操作 符 (参见 4. 5 节 ) 一 般 都 能 适用 于 所 有 的 序列 类 型 。 当 然 ， 如 果 作 复合 类 型 的 
































对 象 比较 的 话 ， 这 样 说 可 能 需要 有 所 保留 ， 不 过 其 他 的 操作 绝对 是 完全 适用 的 。 


6.1.2 序列 类 型 操作 符 
R 6. 1 列 出 了 对 所 有 序列 类 型 都 适用 的 操作 符 。 操 作 符 是 按照 优先 级 从 高 到 底 的 顺序 排列 
的 。 





成 员 关 系 操作 符 (in, not in) 





成 员 关 系 操作 符 使 用 来 判断 一 个 元 素 是 否 属于 一 个 序列 的 。 比 如 对 字符 串 类 型 来 说 ， 就 是 
判断 一 个 字符 是 否 属于 这 个 字符 串 ， 对 和 元 组 类 型 来 说 ， 就 代表 了 一 个 对 象 是 否 属于 该 对 象 序 
列 。in/not in 操作 符 的 返回 值 一 般 来 讲 就 是 True/False， 满 足 成 员 关 系 就 返回 True, BUR 
回 False。 该 操作 符 的 语法 如 下 ; 




















obj [not] in sequence 


dim 
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表 6. 1 序列 类 型 操作 符 


序列 操作 符 作用 

seq[ind] 获得 下 标 为 ind 的 元 素 
seq[indl:ind2] 获得 下 标 从 indl 到 ind2 间 的 元 素 集 合 
seq * expr 序列 重复 expr 次 

seql + seq2 连接 序列 seql 和 seq2 

obj in seq 判断 obj 元 素 是 否 包含 在 seq 中 

obj not in seq 判断 obj 元 素 是 否 不 包含 在 seq 中 








连接 操作 符 ( + ) 
这 个 操作 符 允 许 我 们 把 一 个 序列 和 男 一 个 相同 类 型 的 序列 做 连接 。 语 法 如 下 : 




















起 来 似乎 实现 了 把 两 个 序列 内 容 合 并 的 概念 ,但 是 这 个 操作 不 是 最 快 或 者 说 最 有 效 的 。 对 字符 
串 来 说 ， 这 个 操作 不 如 把 所 有 的 子 字 符 串 放 到 一 个 列表 或 可 和 欠 代 对 象 中 ， 然 后 调用 一 个 join 
方法 来 把 所 有 的 内 容 连 接 在 一 起 节约 内 存 ;类 似 地 ， 对 列表 来 说 ， 我 们 推荐 读者 用 列表 类 型 的 
extend () 方 法 来 把 两 个 或 者 多 个 列表 对 象 合并 . 当 你 需要 简单 地 把 两 个 对 象 的 内 容 合 并 , 或 者 说 
不 能 依赖 于 可 变 对 象 的 那些 没有 返回 值 (实际 上 它 返 回 一 个 None) 的 内 建 方法 来 完成 的 时 候 时 ， 
连接 操作 符 还 是 很 方便 的 一 个 选择 。 下 面 的 切片 操作 可 以 视 作 这 些 情况 的 例子 。 


sequencel + sequence? 
该 表达 式 的 结果 是 一 个 包含 sequencel 和 sequence2 的 内 容 的 新 序列 . 注意 ， 这 种 方式 看 $ 






































重复 操作 符 ( * ) 

当 你 需要 需要 一 个 序列 的 多 份 拷 贝 时 ， 重 复 操作 符 非 常 有 用 ， 它 的 语法 如 下 : 

sequence * copies int 

copies int 必须 是 一 个 整数 (1.6 节 里 面 有 讲 到 , 不 能 是 长 整数 ). 像 连接 操作 符 一 样 ， 该 操 
作 符 返回 一 个 新 的 包含 多 份 原 对 象 拷贝 的 对 象 。 




















切片 操作 符 ( []，[:],，[::] ) 
简单 地 讲 , 所 谓 序列 类 型 就 是 包含 一 些 顺序 排列 的 对 象 的 一 个 结构 . 你 可 以 简单 的 用 方 括号 
加 一 个 下 标的 方式 访问 它 的 每 一 个 元 素 , 或 者 通过 在 方 括号 中 用 冒号 把 开始 下 标 和 结束 下 标 分 
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开 的 方式 来 访问 一 组 连续 的 元 素 . 下 面 我 们 将 详细 的 讲解 提 到 的 这 两 种 方式 . 序列 类 型 是 其 元 素 
被 顺序 放置 的 一 种 数据 结构 类 型 , 这 种 方式 允许 通过 指定 下 标的 方式 来 获得 某 一 个 数据 元 素 , 或 
者 通过 指定 下 标 范围 来 获得 一 组 序列 的 元 素 . 这 种 访问 序列 的 方式 叫做 切片 , 我 们 通过 切片 操作 
符 就 可 以 实现 我 们 上 面 说 到 的 操作 。 访 问 某 一 个 数据 元 素 的 语法 如 下 : 

sequence [index] 

sequence 是 序列 的 名 字 ，index 是 想 要 访问 的 元 素 对 应 的 偏 移 量 . 偏 移 量 可 以 是 正 值 , 范围 
从 0 到 偏 移 最 大 值 ( 比 序列 长 度 少 一 ) ,用 len O 函数 〈 下 一 节 会 讲 )， 可 以 得 到 序列 长 度 ， 实 际 
的 范围 是 0 《= inde <= len(sequece)-1 .另外 ， 也 可 以 使 用 负 索 引 ， 范 围 是 -1 到 序列 的 负 
KÆ, -len(sequence), -len(sequence) <= index <= -1. 正 负 索 引 的 区 别 在 于 正 索引 以 序列 
的 开始 为 起 点 ， 负 索引 以 序列 的 结束 为 起 点 . 试图 访问 一 个 越界 的 索引 会 引发 一 个 如 下 的 异常 : 





























2» names = (Faye', 'Leanna', "Daylen') 

> print names[4] 

Traceback (most recent call last): File “<stdin)”, line l, in ? 
IndexError: tuple index out of range 





赋值 给 一 个 变量 ) : 
2» print ( Faye’, 'Leanna', 'Daylen' )[1] 
Leanna 





因为 Python 是 面向 对 象 的 , 所 以 你 可 以 像 下 面 这 样 直接 访问 一 个 序列 的 元 素 ( 不 用 先 把 它 





这 个 特性 在 你 调用 一 个 返回 值 是 序列 类 型 的 函数 ， 并 且 你 只 对 返回 的 序列 中 的 一 个 或 某 几 
个 元 素 感 兴趣 时 特别 有 用 . 

那么 我 们 如 何 才能 一 次 得 到 多 个 元 素 呢 ? 其 实 这 跟 访 问 某 一 个 单一 元 素 一 样 简 单 ， 只 要 简 
单 的 给 出 开始 和 结束 的 索引 值 ， 并 且 用 冒号 分 隔 就 可 以 了 ， 其 语法 如 下 : 

















sequence[starting index:ending index] 











通过 这 种 方式 我 们 可 以 得 到 从 起 始 索引 到 结束 索引 〈 不 包括 结束 索引 对 应 的 元 素 ) 之 间 的 
一 H^ TR. 起 始 索引 和 结束 索引 都 是 可 选 的 , 如 果 没 有 提供 或 者 用 None 作为 索引 值 , 切片 操作 
会 从 序列 的 最 开始 处 开始 , 或 者 直到 序列 的 最 末尾 结束 . 在 图 6-2 和 6-6 里 面 , 我 们 以 一 个 长 度 
为 5 的 序列 为 例 ， 分 别 讲解 了 这 几 种 切片 方式 。 
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6-2 Entire sequence: sequence or sequence[:] 





6-3 ”序列 切片 操作 : ”sequence[0:3] 或 者 sequence[:3] 


用 步 长 索引 来 进行 扩展 的 切片 操作 

序列 的 最 后 一 个 切片 操作 是 扩展 切片 操作 ， 它 多 出 来 的 第 三 个 索引 值 被 用 做 步 长 参数 。 你 
可 以 把 这 个 参数 看 成 跟 内 建 函 数 range 0 里 面 的 步 长 参数 或 者 类 似 于 C/C++, Perl, PHP 和 Java 
语言 里 面 for 语句 中 的 步 长 参数 一 样 来 理解 。 Python 的 虚拟 机 里 面 其 实 很 早 就 有 了 扩展 切片 
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操作 ， 只 不 过 以 前 需要 通过 扩展 的 方式 来 使 用 。Jython 也 支持 这 个 语法 (以 前 叫 JPython) 














6-4 ”序列 切片 操作 : sequence[2:5] 










y 


9, 
* 
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图 6-5 ”序列 切片 操作 : sequence[1:3] 


i. 79 
4 








long before version 2.3 of the C interpreter gave everyone else access to it. 
以 下 是 几 个 例子 : 

2» s = 'abedefgh' 

D> s[:-1] 8 ATURE HBR PELE 

"hgfedcba' 
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D> s[Í:2] — # BE —TRR—-TR HERE 


3 2 
aceg 





6-6 ”序列 切片 操作 : sequence[3] 


切片 索引 的 更 多 内 容 














切片 索引 的 语法 要 比 简 单 的 单一 元 素 索引 灵活 的 多 。 开 始 和 结束 素 引 值 可 以 超过 字符 串 的 
长 度 。 换 句 话说， 起 始 索引 可 以 小 于 0, 而 对 于 结束 索引 ， 即 使 索引 值 为 100 的 元 素 并 不 存在 也 
不 会 报错 ， 简 单 地 说 ， 即 使 用 100 来 作为 一 个 长 度 不 到 100 的 序列 的 结束 索引 也 不 会 有 什么 问 
题 ， 例 子 如 下 : 

2^ ( Faye’, 'Leanna', 'Daylen')[-100: 100] 

C Faye’, 'Leanna', 'Daylen') 

















有 这 么 一 个 问题 : 有 一 个 字符 串 ， 我 们 想 通 过 一 个 循环 按照 这 样 的 形式 显示 它 : 每 次 都 把 
位 于 最 后 的 一 个 字符 砍 掉 ， 下 面 是 实现 这 个 要 求 的 一 种 方法 : 























29 s = abede’ 
>>>7 = 一 7 
2» for i in range(-l, -len(s), -1): 
print s[:i] 
abcd 





o 
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nfi. VALE SS AARRE RENFRI? 是 否 有 一 种 方法 可 以 不 用 在 整个 循 
环 之 前 加 入 一 个 额外 的 print 语句 呢 ? 我 们 该 如 何 定义 一 个 索引 ， 来 代表 整个 的 序列 呢 ? 事实 
上 在 个 以 负数 作为 索引 的 例子 里 是 没有 一 个 真正 能 解决 这 个 问题 的 方法 的 ， 因 为 -1 已 经 是 “最 
小 ”的 索引 了 . 我 们 不 可 能 用 0 来 作为 索引 值 ， 因 为 这 会 切片 到 第 一 个 元 素 之 前 而 什么 都 不 会 显 
ZN: 























2» s[:0] 





我 们 的 方案 是 使 用 男 一 个 小 技巧 :用 None 作为 索引 值 ， 这 样 一 来 就 可 以 满足 你 的 需要 ， 比 
如 说 ， 在 你 想 用 一 个 变量 作为 索引 来 从 第 一 个 到 遍历 最 后 一 个 元 素 的 时 候 : 


2» s = ‘abcde’ 
2» for i in [None] + range(-1 -len(s), -D): 
print s[:i] 


abcde 
abcd 
abc 


ab 
a 








现在 这 个 程序 符合 我 们 的 要 求 了 。 在 进行 下 面 的 内 容 之 前 ， 必 须 指 出 ， 似 乎 还 可 以 先 创建 
一 个 只 包含 None 的 列表 , 然后 用 extend 0 函数 把 range 0 的 输出 添加 到 这 个 列表 , 或 者 先 建立 
range () 输出 组 成 的 列表 然后 再 把 None 插入 到 这 个 列表 的 最 前 面 ， 然 后 对 这 个 列表 进行 志 历 ， 
但 是 可 变 对 象 的 内 建 函 数 extend 0 根本 就 没有 返回 值 ， 所 以 这 个 方法 是 行 不 通 的 : 





一 











2» for i in [None]. extend(range C1, -len (s), -1)): 
print sii] 


Traceback (most recent call last): 
File f&Xstdin^/^, line l, in ? 


TypeError: iteration over non-sequence 
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这 个 错误 发 生 的 原因 是 [Nonej. extend C...) ek BGI] None , None 既 不 是 序列 类 型 也 不 是 
可 迭代 对 象 ， 这 种 情况 下 使 用 上 面 提 到 的 的 列表 连接 操作 来 实现 是 唯一 不 需要 添加 额外 代码 的 

















6.1.3 内 建 函 数 (BIFs) 


在 讲解 序列 类 型 的 内 建 函 数 之 前 ， 有 一 点 需要 说 明 , 序列 本 身 就 内 含 了 和 迭代 的 概念 ， 之 所 以 
会 这 样 ， 是 因为 迭代 这 个 概念 就 是 从 序列 ， 友 代 器 ， 或 者 其 他 支持 迭代 操作 的 对 象 中 泛 化 得 来 
的 。 由 于 Python 的 for 循环 可 以 裔 历 所 有 的 可 壕 代 类 型 ,在 ( 非 纯 序列 对 象 上 ) 执行 for 循环 时 
就 像 在 一 个 纯 序列 对 象 上 执行 一 样 。 而且 Python 的 很 多 原来 只 支持 序列 作为 参数 的 内 建 函 数 现 
在 也 开始 文 持 迭代 器 或 者 或 类 迭代 器 了 . 我 们 把 这 些 类 型 统称 为 "可 迭代 对 象 “在 这 一 章 里 我 们 
会 详细 的 讨论 跟 序列 关系 紧密 的 内 建 函 数 (BIF)， 在 第 八 章 “ 条 件 判断 和 循环 “里 面 将 讨论 针对 
在 循环 中 迭代 “这 种 情况 的 内 建 函 数 BIF). 


内 建 函 数 List, str 上 和 tuple 0 被 用 做 在 各 种 序列 类 型 之 间 转 换 。 你 可 以 把 它们 理解 成 
其 他 语言 里 面 的 类 型 转换 ， 但 是 并 没有 进行 任何 的 转换 。 这 些 转换 实际 上 是 工厂 函数 〈 在 第 4 
章 介 绍 )， 将 对 象 作 为 参数 ， 并 将 其 内 容 〈 浅 ) 拷贝 到 新 生成 的 对 象 中 . 表 6. 2 列 出 了 适用 于 序 
列 类 型 的 转换 函数 。 





















































表 6.2 序列 类 型 转换 工厂 函数 


list(iter) ”把 可 迭代 对 象 转换 为 列表 

str (obj) 把 obj 对 象 转换 成 字符 串 (对 象 的 字符 串 表 示 法 ) 

unicode (obj) 把 对 象 转换 成 Unicode 字符 串 (使 用 默认 编码 ) 

basestringO 抽象 工厂 函数 , 其 作用 仅仅 是 为 str 和 unicode 函数 提供 父 类 ， 所 以 不 能 被 
实例 化 ， 也 不 能 被 调用 ( 详 见 第 6. 2 节 ) 

tuple (iter) ”把 一 个 可 迭代 对 象 转换 成 一 个 元 组 对 象 
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我 们 又 用 了 一 次 “转换 ”这 个 词 。 不 过 ， 为 什么 Python 里 面 不 简单 地 把 一 个 对 象 转换 成 另 
一 个 对 象 呢 ? 回 过 头 看 一 下 第 4 章 就 会 知道 ， 一 旦 一 个 Python 的 对 象 被 建立 ， 我 们 就 不 能 更 改 
其 身份 或 类 型 了 . 如 果 你 把 一 个 列表 对 象 传 给 1ist () 函数 ， 便 会 创建 这 个 对 象 的 一 个 浅 拷贝 ， 
然后 将 其 插入 新 的 列表 中 。 同 样 地 ， 在 做 连接 操作 和 重复 操作 时 ， 我 们 也 会 这 样 处 理 。 



































所 谓 浅 找 贝 就 是 只 拷贝 了 对 对 象 的 索引 ， 而 不 是 重新 建立 了 一 个 对 象 ! 如 果 你 想 完 全 的 找 
贝 一 个 对 象 (包括 递归 ， 如 果 你 的 对 象 是 一 个 包含 在 容器 中 的 容器 ), 你 需要 用 到 深 找 贝 ， 关 于 浅 
拷贝 和 深 找 贝 的 更 多 信息 会 在 本 章 的 末尾 讲 到 。 














str O 函数 在 需要 把 一 个 对 象 的 可 打印 信息 输出 时 特别 有 用 ,不 仅仅 是 对 序列 类 型 ， 对 其 他 
类 型 的 对 象 同样 如 此 . Unicode O 是 str O 函数 的 unicode 版 本 , 它 跟 str O 函数 基本 一 样 . 1ist O 
和 tuple O 函数 在 列表 类 型 和 元 组 类 型 的 互 换 时 非常 有 用 . 不 过 , 虽然 这 些 函 数 也 适用 于 string 
类 型 (因为 string 类 型 也 是 序列 的 一 种 ), 但 是 在 string 类 型 上 应 用 tupleO 和 1ist 0 函数 却 得 
不 到 我 们 通常 希望 的 结果 . 
































Operational 
Python 为 序列 类 型 提供 以 下 可 操作 BIFs ( 见 表 6.3). 注意 ，len(), reversed() 和 sum Q K 
数 只 能 接受 序列 类 型 对 象 作 为 参数 , TOE PAU WA BESS HY IRR RINE RL, 男 外 , max O 
和 min O 函数 也 可 以 接受 一 个 参数 列表 . 
Xx 6.3 序列 类 型 可 用 的 内 建 函 数 








enumerate(iter) * 接受 一 个 可 迭代 对 象 作 为 参数 ， 返 回 一 个 enumerate 对 象 ( 同 
时 也 是 一 个 迭代 器 ) , 该 对 象 生 成 由 iter 每 个 元 素 的 index 值 
和 item 值 组 成 的 元 组 (PEP 279) 
len (seq) 返回 seq 的 长 度 
max (iter, key=None) or 
max (arg0, argl..., key=None)’ 返回 iter EX (arg0, argl,...) 中 的 最 大 值 , 如 果 指 定 了 key， 
这 个 key 必须 是 一 个 可 以 传 给 sort 0 方法 的 , 用 于 比较 的 回 
调 函 数 . 





min(iter，key=None) or 
min(argO0, argl.... key=None) "返回 iter 里 面 的 最 小 值 ;或 者 返回 (arg0, arg2, ...) 里面 
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的 最 小 值 ;如 果 指 定 了 key, 这 个 key 必须 是 一 个 可 以 传 给 
sort Q 方法 的 ， 用 于 比较 的 回调 函数 . 





reversed(seq)' 接受 一 个 序列 作为 参数 , J [8] —] ELLE; H Ras (PEP 322) 

sorted(iter, 

func=None, 

key=None, 

reverse-False)' 接受 一 个 可 迭代 对 象 作为 参数 ， 返 回 一 个 有 序 的 列表 ;可 选 参数 
func, key 和 reverse 的 含义 跟 list. sort O 内 建 函 数 的 参数 含义 一 
样 . 

sum(seq, init-0)' 返回 seq 和 可 选 参数 init 的 总 和 ,其 效果 等 同 于 
reduce (operator. add, seq, init) 

zip([itO0, itl,... itND' 返回 一 个 列表 ， 其 第 一 个 元 素 是 itd, itl,... 这 些 元 素 的 第 

一 个 元 素 组 成 的 一 个 元 组 ， 第 二 个 . . . ,类推 . 














Python2. 3 新 增 
从 Python2. 5 开始 支持 关键 字 参 数 
Python2. 4 开始 支持 

Python2. 0 加 入 ，Python2. 4 加 强 





Sra 2.2 

















我 们 将 分 别 在 每 个 序列 的 章节 里 面 提供 使 用 这 些 函 数 的 例子 . 


6.2 字符 串 

字符 串 类 型 是 Python 里 面 最 常见 的 类 型 . 我们 可 以 简单 地 通过 在 引号 间 包 含 字符 的 方式 
创建 它 . Python 里 面 单 引 号 和 双 引 号 的 作用 是 相同 的 ， 这 一 点 Python 不 同 于 其 他 类 Shell 的 脚 
本 语言 ， 在 这 些 脚 本 语言 中 ， 通 常 转 义 字符 仅仅 在 双 引 号 字符 串 中 起 作用 ， 在 单一 号 括 起 的 字 
符 串 中 不 起 作用 。Python 用 “原始 字符 串 “ 操 作 符 来 创建 直接 量 字符 串 , 所 以 再 做 区 分 就 没什么 
意义 了 。 其 他 的 语言 ， 比 如 C 语言 里 面 用 单 引 号 来 标示 字符 ， 双 引号 标示 字符 串 , 而 在 Python 
里 面 没 有 字符 这 个 类 型 . 这 可 能 是 双 引 号 和 单 引号 在 Python 里 面 被 视 作 一 样 的 的 另 一 个 原因 
几乎 所 有 的 Python 应 用 程序 都 会 某 种 方式 用 到 字符 串 类 型 . 字符 串 是 一 种 直接 量 或 者 说 是 一 种 
标量 , 这 意味 着 Python 解释 器 在 处 理 字符 串 时 是 把 它 作为 单一 值 并 且 不 会 包含 其 他 Python 类 型 
的 。 字 符 串 是 不 可 变 类 型 , 就 是 说 改变 一 个 字符 串 的 元 素 需 要 新 建 一 个 新 的 字符 串 . 字符 串 是 由 
独立 的 字符 组 成 的 ， 并 且 这 些 字符 可 以 通过 切片 操作 顺序 地 访问 。 
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根据 在 2.2 章节 里 面 对 类 型 和 类 的 概念 进行 的 统一 ，Python 实际 上 有 3 类 字符 串 . 通 
义 的 字符 串 (str) 和 Unicode 字符 串 (unicode) 实际 上 都 是 抽象 类 basestring MFR. 
basestring 是 不 能 实例 化 的 ， 如 果 你 试图 实例 化 一 个 basestring 类 , 你 会 得 到 以 下 报错 信 ， 








222^ basestring( foo’) 


Traceback (most recent call last): File “<stdin>”, line 1, in «module» 


TypeError: The basestring type cannot be instantiated 


字符 串 的 创建 和 赋值 


创建 一 个 字符 串 就 像 使 用 一 个 标量 一 样 简单 ， 当 然 你 也 可 以 把 str 0 作为 工厂 方法 来 创建 











一 个 字符 串 并 把 它 赋值 给 一 个 变量 : 


2» aString = 'Hello World!’ # f€@H4##AF 
22» anotherString = “Python is cool!” # AXK IGF 
2M» print aString # print 4l Hello World! 
2» anotherString # PÆN print ME, FAA FS 
’Python is cool!’ 
Mo s = str(range(4)) # -PAURE hk -NFE 
222 sS 
A L 2 3P 


如 何 访问 字符 串 的 值 (字符 和 子 串 ) 





Ea 


Y 


di 





> üb 


vo 


mM 


Yve 


t 





Python 里 面 没有 字符 这 个 类 型 , 而 是 用 长 度 为 1 的 字符 串 来 表示 这 个 概念 , 当然 ， 这 其 实 也 








是 一 个 子 串 。 用 方 括 号 加 一 个 或 者 多 于 一 个 索引 的 方式 来 获得 子 串 : 


2» aString = 'Hello World!’ 
2» aString[0] 

ur 

22» aStringí1:5] 

'ello' 

22» aString[6:] 

World!’ 


如 何 改变 字符 串 





+- > 





Edit By Vheavens 








e+ 





Edit By Vheavens 


e. ee e| 





你 可 以 通过 给 一 个 变量 赋值 (或 者 重 赋值 ) 的 方式 “更 新 ”一 个 已 有 的 字符 串 . 新 的 值 可 能 
与 原 有 值 差不多 ， 也 可 能 跟 原 有 串 完全 不 同 。 











2» aString = aString[:6] + 'Python!' 

2225 aString 

"Hello Python!’ 

2» aString = ‘different string altogether’ 
222 aString 

'different string altogether’ 








跟 数 字 类 型 一 样 ， 字 符 串 类 型 也 是 不 可 变 的 ， 所 以 你 要 改变 一 个 字符 串 就 必须 通过 创建 一 
个 新 串 的 方式 来 实现 。 也 就 是 说 你 不 能 只 改变 一 个 字符 串 的 一 个 字符 或 者 一 个 子 串 ， 然 而 ， 通 
过 拼凑 一 个 旧 串 的 各 个 部 分 来 得 到 一 个 新 串 是 被 允许 的 ， 正 如 上 面 你 看 到 的 那样 . 














如 何 删除 字符 和 字符 串 

再 重复 一 遍 ， 字 符 串 是 不 可 变 的 , 所 以 你 不 能 仅仅 删除 一 个 字符 串 里 的 某 个 字符 , 你 能 做 的 
是 清空 一 个 空 字符 串 , 或 者 是 把 吻 除 了 不 需要 的 部 分 后 的 字符 串 组 合 起 来 形成 一 个 新 串 。 假 设 
你 想 要 从 ”Hello World!“ 里 面市 除 小 写 的 "1 














2» aString = 'Hello World!’ 
2» aString = aString[:3] + aString[4:] 
225 aString 
'"Helo World!’ 


通过 赋 一 个 空 字符 串 或 者 使 用 del 语句 来 清空 或 者 删除 一 个 字符 串 : 
2M» aString = '' 
225 aString 


222 del aString 
在 大 部 分 应 用 程序 里 ， 没 有 必要 显 式 的 删除 字符 串 。 定 义 这 个 字符 串 的 代码 最 终 会 结束 ， 
那 时 Python 会 自动 释放 这 些 字符 串 . 


6.3 ”字符 串 和 操作 符 
6. 3.1 标准 类 型 操作 符 
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dim 
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在 第 4 章 里 面 ， 我 们 介绍 了 一 些 适用 于 包括 标准 类 型 在 内 的 大 部 分 对 象 的 操作 符 ， 在 这 里 
再 看 一 下 这 些 其 中 的 一 些 操作 符 是 怎样 作用 于 字符 串 类 型 的 , 下 面 是 几 个 简单 的 例子 : 


2» strl = ’abc’ 

2M» str2 = Imn’ 

2» str8 = xyz’ 

2225 strl < str2 

True 

2225 str2 /= str3 

True 

2» strl < str3 and str? == ’xyz’ 
False 


在 做 比较 操作 的 时 候 ， 字 符 串 是 按照 ASCII 值 的 大 小 来 比较 的 . 


6. 3. 2 站 
切片 ([] 和 [:]) 


在 早先 地 6.1.1 章节 里 面 我 们 展示 了 如 何 访问 序列 类 型 的 一 个 或 一 组 元 素 , 接 下 来 我 们 会 
把 这 些 知识 应 用 到 字符 串 类 型 上 ， 着 重 考察 以 下 的 操作 : 





e iix 
e 反 向 索引 
e 默认 索引 





eu 


接 下 来 以 字符 串 abcd 为 例子 . 表 里 面 分 别 列 出 了 使 用 正 索引 和 负 索 引 来 定位 字符 的 情 ; 
"uuu IGI 


nnn 


FW 




















2» aString = ’abcd’ 
2^» len(aString) 


dim 
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正 向 索引 时 , 索引 值 开始 于 0, 结束 于 总 长 度 减 1 (因为 我 们 是 从 0 开始 索引 的 ). 本 例 中 最 后 
一 个 索引 是 : 


final index = len(aString) - 1 
=4.= ] 
= 8 


在 这 个 范围 内 ， 我 们 可 以 访问 任意 的 子囊。 用 一 个 参数 来 调用 切片 操作 符 结果 是 一 个 单 
字符 ， 而 使 用 一 个 数值 范围 (用 " : ) 作为 参数 调用 切片 操作 的 参数 会 返回 一 串 连续 地 字符 . 再 强 


调 一 通 , 对 任何 范围 Lstart:endj, 我 们 可 以 访问 到 包括 start 在 内 到 end (不 包括 end) 的 所 有 字 
符 ， 换 名 话说， 假设 xx 是 [start:end] 中 的 一 个 索引 值 ， 那 么 有 : start<= x < end. 

















> aStringí0] 


a 
2 aStringí1:3] 
pe? 
2» aString[2:4] 
od? 
2» aString[4] 
Traceback (innermost last): File ^stdin^^ line 1, in ? 
IndexError: string index out of range 





使 用 不 在 允许 范围 (本 例 中 是 0 到 3) 内 的 索引 值 会 导致 错误 。 上 面 的 aString[2:4] AFF 
有 出 错 ， 那 是 因为 实际 上 它 返 回 的 是 索引 值 2 和 3 的 值 。 但 是 直接 拿 4 作为 索引 访问 是 不 被 允 
许 的 。 

在 进行 反 向 索引 操作 时 , 是 从 -1 开始 ， 向 字符 串 的 开始 方向 计数 ， 到 字符 串 长 度 的 负数 为 
索引 的 结束 。 最 末 一 个 索引 (也 就 是 第 一 个 字符 ) 是 这 样 定位 的 : 











final index = -len(aString) 
= -4 


2» aString[-1] 
^q 

2» aString[-3:-1] 
pe? 

2» aString[-4] 

a 





dim 
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如 果 开 始 索引 或 者 结束 索引 没有 被 指定 ， 则 分 别 以 字符 串 的 第 一 个 和 最 后 一 个 索引 值 为 
默认 值 。 
2» aStringí2: ] 
"eg" 
22» aString[1:] 
"bed? 
2» aString[:-1] 
"abc 
2» aString[:] 
abed’ 


注意 : 起 始 / 结 束 索 引 都 没有 指定 的 话 会 返回 整个 字符 串 . 






T 




















E 











成 员 操 作 符 (in , not in) 

成 员 操作 符 用 于 判断 一 个 字符 或 者 一 个 子 串 (中 的 字符 ) 是 否 出 现在 男 一 个 字符 串 中 。 出 现 
则 返回 True, BURE False. 注意 , 成 员 操 作 符 不 是 用 来 判断 一 个 字符 串 是 否 包含 男 一 个 字符 
串 的 ， 这 样 的 功能 由 find 0) 或 者 index) (还 有 它们 的 兄弟 : rfindO 〇 和 rindex0) 函 数 来 完成 











n 














下 面 是 一 些 字符 串 和 成 员 操 作 符 的 例子 . 
在 Python2.3 以 前 ，in( 和 not in) 操 作 符 只 允许 用 来 判断 一 个 单个 字符 是 否 属于 一 个 字 
符 串 , 就 像 下 面 第 二 个 例子 那样 . 2. 3 以 后 这 个 限制 去 掉 了 ， 所 有 的 字符 串 都 可 以 合 来 判断 





> 'bc! in 'abcd' True 
2» 'n! in abed’ False 
>) 'nm not in abcd? True 


在 例 6.1 里 面 ， 我 们 会 用 到 下 面 这 些 string 模块 预定 义 的 字符 串 : 
222 import string 





222 string. ascii uppercase 

" ABCDEFGHI JKLMNOPQRS TUVWXYZ” 

222 string. ascii lowercase 

'abcdefghi jklmnopqrstuvwxyz’ 

222 string. ascii letters 

'abcdefghi jklmnopars tuvwxyzABCDEFGHI JKLMNOPQRSTUVWXYZ" 





dim 
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f| 6.1 是 一 个 用 来 检查 Python 有 效 标 识 符 的 小 脚本 , 名 字 是 idcheck. py. 我 们 知道 ， 
Python 标识 符 必 须 以 字母 或 下 划 线 开头 ， 后 面 跟 字 母 , 下 划 线 或 者 数字 . 





222 string. digits 
'0123456789' 





例 6.1 标识 符 检查 (idcheck. py) 














标识 符合 法 性 检查 ， 首 先 要 以 字母 或 者 下 划 线 开始 ， 后 面 要 跟 字 母 , 下 划 线 或 者 或 数字 . 
这 个 小 例子 只 检查 长 度 大 于 等 于 2 的 标识 符 . 
l#!usr/bin/env python 
2 
Jimport string 
4 
5 alphas = string. letters +? ’ 








6 nums = string. digits 


8 print 'Welcome to the Identifier Checker v1.0’ 
9 print 'Testees must be at least 2 chars long." 
10 inp = raw input( Identifier to test? `) 


12 if len(myInput) > 1: 
14 if myInput[0/ not in alphas: 


15 print "invalid: first symbol must be 
16 alphabetic’’’ 


I7 else: 
18 for otherChar in myInput[1:/: 
19 


20 if otherChar not in alphas + nums: 
21 print ''' invalid: remaining 


22 symbols must be alphanumeric’ 
23 break 


dim 
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这 个 例子 还 展示 了 字符 串 连 接 符 ( + ) 的 使 用 , 本 章 的 后 面 会 讲 到 字符 串 连 接 符 . 运行 几 次 
后 得 到 下 面 的 输出 : 





24 else: 
25 print “okay as an identifier” 











$ python idcheck. py 

Welcome to the Identifier Checker vl. 0 

Testees must be at least 2 chars long. Identifier to test? counter 
okay as an identifier 

$ 

$ python idcheck. py 

Welcome to the Identifier Checker vl. 0 

Testees must be at least 2 chars long. Identifier to test? 3d_effects 
invalid: first symbol must be alphabetic 


证 我 们 逐 行 解释 这 个 应 用 程序 。 


3-6 行 
导入 string 模块 并 且 预 定义 了 两 个 字符 





， 用 于 后 面 的 判断 


Tn. 


8-12 1T 
输出 提示 信息 ， 第 12 行 的 if 语句 过 滤 掉 长 度 小 于 2 的 标识 符 或 者 候选 标识 符 . 


14-16 fT 
检查 第 一 个 符号 是 不 是 字母 或 下 划 线 ， 如 果 不 是 ， 输 出 结果 并 退出 。 





17-18 行 
否则 ， 从 第 二 个 字符 开始 到 最 后 一 个 字符 ， 循 环 检查 剩余 的 字符 . 


20-23 行 
检查 剩余 的 符号 是 否 都 是 字母 ,下划线 或 者 数字 . 注意 我 们 是 如 何 使 用 连接 操作 符 来 创建 
法 字符 集合 的 。 只 要 发 现 一 个 非法 字符 ， 就 显示 结果 并 通过 break 语句 退出 。 
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核心 提示 : 性 能 

一 般 来 说 ， 从 性 能 的 的 角度 来 考虑 , 把 重复 操作 作为 参数 放 到 循环 里 面 进行 是 非常 低 效 的 . 

while i < len(myString): 

print 'character Xd is:', myStringli] 

上 面 的 循环 操作 把 大 把 的 时 间 都 浪费 到 了 重复 计算 字符 串 myString 的 长 度 上 了 . 每 次 循环 
友 代 都 要 运行 一 次 这 个 函数 . 如 果 把 这 个 值 做 一 次 保存 , 我 们 就 可 以 用 更 为 高 效 的 方式 重 写 我 们 
的 循环 操作 . 

length = len(myString) 

while i < length: 

print 'character %d is:', myString[i] 

这 个 方法 同样 适用 于 上 面 的 例 6. 1 

for otherChar in myInput[1:]: 

if otherChar not in alphas * nums: 


被 合并 的 这 两 个 字符 串 从 始 至 终 就 没 变 过 ， 而 每 次 都 会 重新 进行 一 次 计算 . 如 果 先 把 这 两 个 字 
符 串 存 为 一 个 新 字符 串 ， 我 们 就 可 以 直接 引用 这 个 字符 串 而 不 用 进行 重复 计算 了 。 

alphnums = alphas + nums 

for otherChar in myInput[1:]: 

if otherChar not in alphnums: 


$ 第 18 行 的 for 循 环 包 含 了 一 个 证 语句 ,在 这 个 证 里 面 执行 了 合并 两 个 字符 串 的 操作 。 + 


24-25 fT 

或 许 现在 就 向 你 展示 for-else 循环 语句 有 点 儿 早 ， 可 是 我 们 必需 先 看 一 看 这 个 语句 (在 第 
8 章 有 详细 的 介绍 ). for 循环 的 else 语句 是 一 个 可 选项 , 它 只 在 for 循环 完整 的 结束 , 没有 遇 到 
break 时 执行 。 在 我 们 的 例子 中 ， 如 果 所 有 的 符号 都 检查 合格 ， 那 么 我 们 就 得 到 了 一 个 合法 的 
标识 符 ， 程 序 会 返回 一 个 这 样 的 结果 ， 然 后 执行 完毕 。 

其 实 ,这 段 程序 并 不 是 完美 的 , 一 个 问题 就 是 标识 符 的 长 度 必须 大 于 1. 我 们 的 程序 几乎 是 ， 
但 还 并 没有 真正 定义 出 Python 标识 答 的 范围 ，Python 标识 符 长 度 可 以 是 1. 另 一 个 问题 是 这 段 
程序 并 没有 考虑 到 Python 的 关键 字 , 而 这 些 都 是 作为 保留 字 , 不 允许 用 做 标识 符 的 . 我 们 把 这 两 
个 问题 作为 课 后 练习 留 给 读者 ( 见 练习 6-2) 。 
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连接 符 ( + ) 
运行 时 刻字 符 串 连接 
我 们 可 以 通过 连接 操作 符 来 从 原 有 字符 串 获 得 一 个 新 的 字符 串 . 我 们 已 经 在 前 面 的 例 
6-1 里 面 见识 过 连接 符 了 ， 下 面 是 一 些 更 多 的 例子 : 

















25» 'Spanish' + 'Inquisition' 


"Spanishinquisition' 


225 
2» 'Spanish' +” ' + 'Inquisition' 

"Spanish Inquisition’ 
225 
S»»> s = Spanish’? +’ ' + 'Inquisition  * ' Made Easy’ 
2205 s 

"Spanish Inquisition Made Easy’ 

225 


222 import string 
22^ string. upper(s[:3] + s[20/) # archaic (see below) 
"SPAM" 


最 后 一 个 例子 展示 了 用 一 个 字符 串 s 的 两 个 切片 来 构成 一 个 新 串 的 操作 , M Spanish" 里 
面 切 出 “Spa” 加 上 从 “Made” 里面 切 出 来 的 “M”. 将 抽取 出 来 字符 串 切 片 连接 后 作为 参数 传 给 了 
string. upper () 方 法 ， 该 方法 负责 把 字符 串 的 所 有 字符 都 变 为 大 写 。String 模块 的 方法 是 在 
Pythonl. 6 里 面 添加 进来 的 ， 所 以 这 个 操作 也 可 以 用 最 后 一 个 字符 串 的 一 个 单一 方法 调用 来 完 
成 ( 见 下 面 的 例子 ) 。 现 在 已 经 没有 必要 导入 string 模块 了 ， 除 非 你 需要 访问 该 模块 自己 定义 的 
字符 串 常 量 ,注意 :虽然 对 初学 者 来 说 string 模块 的 方式 更 便于 理解 , 但 出 于 性 能 方面 的 考虑 ， 
我 们 还 是 建议 你 不 要 用 string 模块 。 原 因 是 Python 必须 为 每 一 个 参加 连接 操作 的 字符 串 分 配 
新 的 内 存 ， 包 括 新 产生 的 字符 串 。 了 取而代之， 我 们 推荐 你 像 下 面 介 绍 的 那样 使 用 字符 串 格 式 化 
操作 符 (%) ， 或 者 把 所 有 的 字符 串 放 到 一 个 列表 中 去 ， 然 后 用 一 个 join 0 方法 来 把 它们 连接 在 
一 起 。 



















































































255 'fs “s? % ( Spanish’, ’ Inquisition’) 
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"Spanish Inquisition’ 


225 

2 s =” ’, join(( Spanish’, ’ Inquisition’, 'Made Easy')) 
D»»> s 

"Spanish Inquisition Made Easy’ 

225 


22^ # no need to import string to use string. upper (): 
2^ (sts! % (s[:3], s[20])). upper 0 
"SPAM" 


编译 时 字符 串 连接 
上 面 的 语法 在 运行 时 字符 串 连 接 的 加 法 操作 ， 这 个 用 法 是 非常 标准 的 。Python 中 还 有 一 种 
并 不 是 经 常用 到 ， 更 像 是 一 种 程序 员 的 习惯 用 法 的 语法 .Python 的 语法 允许 你 在 源码 中 把 几 个 
字符 串 连 在 一 起 写 ， 以 此 来 构建 新 字符 串 : 
2» foo = “Hello” ’world!’ 
222 foo 
'Helloworld!' 
通过 这 种 方法 ， 你 可 以 把 长 的 字符 串 分 成 几 部 分 来 号 ， 而 不 用 加 反 斜 枉 。 如 上 所 示 ， 
你 可 以 在 一 行 里 面 混用 两 种 分 号 。 这 种 写法 的 好 处 是 你 可 以 把 注释 也 加 进来 ， 如 下 : 















































2» f-urllib.urlopen( http:// # protocol 
’ localhost’ £ hostname 
':8000' # port 
’/egi-bin/triends2, py’) # file 
如 你 所 想 ， 下 面 就 是 urlopen () 方 法 所 得 到 的 真实 输入 : 





225 pttp ° localhost’ ':8000' '/cgi-bin/friendsZ. py’ 
"http://Iocalhost :8000/cgi-bin/friendsZ. py’ 


普通 字符 串 转化 为 Unicode 字符 串 
如 果 把 一 个 普通 字符 串 和 一 个 Unicode 字符 串 做 连接 处 理 ，Python 会 在 连接 操作 前 先 把 普 
通 字 符 串 转化 为 Unicode 字符 串 : 
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2» Hell? +u ' + World +u!’ 
u Hello World!’ 


重复 操作 符 ( * ) 











重复 操作 符 创建 一 个 包含 了 原 有 字符 串 的 多 个 拷贝 的 新 捉 : 





295 NIE X3 
"Ni INI INI !' 
225 

2205 7 # #40 

^ AAA AAA AAAAA AAAI AAAI IIIA ASS IIIA AS fe 
225 

2» print '—- * 20, 'Hello World!’, '—' * 20 
Hello World! 








255 who = ° knights’ 
222 who * 2 
'"knightsknights' 
225 who 

'"knights' 


像 其 他 的 标准 操作 符 一 样 ， 原 变量 是 不 被 修改 的 ， 就 像 上 面 最 后 一 个 例子 所 示 。 


6.4 只 适用 于 字符 串 的 操作 符 


6.4.1 格式 化 操作 符 ( & ) 

Python 风格 的 字符 串 格式 化 操作 符 。 只 适用 于 字符 串 类 型 ， 非 常 类 似 于 C 语言 里 面 的 
printf O 函数 的 字符 串 格式 化 , 其 至 所 用 的 符号 都 一 样 ,都 用 百 分 号 (%) ,并 且 支 持 所 有 printf O 
式 的 格式 化 操作 . 语法 如 下 : 














左边 的 format_string 里 面 同 通常 会 在 printf O 函数 的 第 一 个 参数 里 面 见 到 的 一 样 :包含 % 





* 
e 





|[e— —o— 一 全 


Edit By Vheavens 








Edit By Vheavens 


_® 











的 格式 化 字符 串 . 表 6.4 列 出 了 可 用 的 各 种 符号 . arguments to convert 参数 是 你 要 转化 、 显示 
的 变量 , 对 应 于 你 送 给 prinf 的 其 他 参数 . 


表 6.4 字符 串 格 式 化 符号 























格式 化 字符 转换 方式 

%c 转换 成 字符 (ASCII 码 值 ， 或 者 长 度 为 一 的 字符 串 ) 

Yr’ 优先 用 repr O 函数 进行 字符 串 转 换 

%s 优先 用 str 0 函数 进行 字符 串 转 换 

Wd / %i 转 成 有 符号 十 进 制 数 

%u” 转 成 无 符号 十 进 制 数 

%o" 转 成 无 符号 八进制 数 

%x"/%X" (Unsigned) 转 成 无 符号 十 六 进 制 数 (x/X 代表 转换 后 的 十 六 进 制 字符 的 大 

小 写 ) 
%e/%E 转 成 科学 计数 法 (e/E 控制 输出 e/E) 
$ %f/%F 转 成 浮 点 数 ( 小 数 部 分 自然 截断 ) E: 

%g/%G %e 和 %f/%E 和 %F 的 简写 
%% 输出 % 





a.  Python2. 0 新 增 ;而且 好 像 只 有 Python 里 面 有 . 
b. Python2.4 里 面 %u/%o/%xV%X 在 遇 到 负数 的 时 候 会 返回 一 个 有 符号 字符 串 

















Python 支持 两 种 格式 的 输入 参数 。 第 一 种 是 元 组 ( 见 2. 8 节 , 6. 15 节 ), 这 基本 上 是 一 种 的 C 
printf (风格 的 转换 参数 集 ; 

Python 支持 的 第 二 种 形式 是 字典 形式 ( 详 见 第 7 38) .字典 其 实 是 一 个 哈 希 键 - 值 对 的 集合 。 

这 种 形式 里 面 ，key 是 作为 格式 字符 串 出 现 ， 相 对 应 的 value 值 作为 参数 在 进行 转化 时 提 
供给 格式 字符 串 . 

格式 字符 串 既 可 以 跟 print 语句 一 起 用 来 向 终端 用 户 输出 数据 ， 又 可 以 用 来 合并 字符 串 形 
成 新 字符 串 ， 而 且 还 可 以 直接 显示 到 GUI (Graphical User Interface) 界面 上 去 . 

其 他 的 格式 字符 和 方法 见 表 6. 5 





























dim 








> - 


Edit By Vheavens 









Edit By Vheavens 


e+ 


X 6.5 格式 化 操作 符 辅 助 指令 

















符号 作用 

* 定义 宽度 或 者 小 数 点 精度 

一 用 做 左 对 齐 

+ 在 正 数 前 面 显示 加 号 ( + ) 

<sp> 在 正 数 前 面 显 示 空 格 

# 在 八进制 数 前 面 显示 零 ( 0 ) ， 在 十 六 进 制 前 面 显 示 ” 0x BK? OX (取决 于 
用 的 是 "x 还 是 X) 

0 显示 的 数字 前 面 填充 “0” 而 不 是 默认 的 空格 

% "X 输出 一 个 单一 的 "% 

(var) 映射 变量 (字典 参数 ) 

m.n nn 是 显示 的 最 小 总 宽度 , n 是 小 数 点 后 的 位 数 ( 如 果 可 用 的 话 ) 


以 下 是 一 些 使 用 格式 字符 串 的 例子 : 


十 六 进 制 输 出 : 
205 “Gx” % 108 
Bo? 
222 
2 “GX” % 108 
^ gc 
225 
205 “VHX % 108 
"OX6C’ 
225 
205 “Ute” % 108 
“Ox6c 


浮 点 数 和 科学 记 数 法 形式 输出 : 
M 
> "Hf % 1234. 567890 





—o— 
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' 1234. 567890’ 


222 

2 7%, 2F % 1234. 567890 
' 1234. 57 

225 


D> WE’ % 1234. 567890 
' I. 284568E*03* 
225 
225 'We' % 1234. 567890 
' 1. 234568e703' 
po 
D> “bg” % 1234. 567890 
"1284. IT? 
Pre 
2 和 % 1234. 567890 
"1234. 57 

225 

>> “he” % CLIE EEUU) 
'"L Hilie*21' 


整数 和 字符 串 输 出 : 
> “td” % 4 
— 

n 

M» “td” % -4 
nq 

M» 


>> “we are at 9 和 % 100 

"we are at 100% 

P» 

2» “Your host is: %s’ % 'earth' 
"Your host is: earth’ 

225 
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2» 'Host: %s\tPort: %d’ % (mars , 80) 
"Host: mars Port: 80° 

225 

>>> num = 123 

225 'dec: %d/oct: %o/hex: %AX’ % (num, num, num) 
'dec: 123/oct: O173/hex: OX7B’ 

225 

>>> “MM/DD/YY = %02d/%02d/%d" % (2, 15, 67) 
"MM/DD/YY = 02/15/67" 

225 

2 w, p = Web’, 'page 

225 'http://xxx. yyy. 222/%s/%s. html’ % (w, p) 
"http://xxx. yyy. zzz/Web/page. html’ 














上 面 的 例子 都 是 使 用 的 元 组 类 型 的 参数 作 转 换 . 下 面 我们 将 把 字典 类 型 的 参数 提供 给 格式 
化 操作 符 . 





2» 'There are %(howmany)d %(lang)s Quotation Symbols’ % | 
{’ lang’: 'Python', 'howmany : 3} 
"There are 3 Python Quotation Symbols’ 


令 人 称奇 的 调试 工具 


字符 串 格 式 化 操作 符 不 仅 很 酷 ， 易 用 ， 上 手 快 , 而 且 是 一 个 非常 有 用 的 调试 工具 。 EKE, 
所 有 的 Python 对 象 都 有 一 个 字符 串 表 示 形 式 

(通过 repr 0 函数 ”或 str0 〇 函数 来 展现 ). print 语句 自动 为 每 个 对 象 调用 str O 函数 ， 
更 好 的 是 , 在 定义 自己 的 对 象 时 ， 你 可 以 利用 ”钩子 为 你 的 对 象 创建 字符 串 表 达 形 式 ， 这 样 ， 
repr()，str0 或 ”或 者 print 被 调用 时 ， 就 可 以 获得 一 个 适当 的 字符 串 描述 信息 . 即使 在 坏 
的 不 能 再 坏 的 情况 下 ，repr ORA str O 也 不 能 显示 一 个 对 象 的 信息 时 ，Pythonic 方式 的 默认 
做 法 最 起 码 能 给 你 返回 想 如 下 格式 的 信息 : 
































<.. something that is useful ... >. 


dim 
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6.4.2 字符 串 模板 : 更 简单 的 蔡 代 品 


字符 串 格 式 化 操作 符 是 Python 里 面 处 理 这 类 问题 的 主要 手段 ， 而 且 以 后 也 是 如 此 。 然 而 它 
也 不 是 完美 的 ， 其 中 的 一 个 缺点 是 它 不 是 那么 直观 ， 尤 其 对 刚 从 CV/C++ 转 过 来 的 Python 新 手 来 
说 更 是 如 此 ， 即 使 是 现在 使 用 字典 形式 转换 的 程序 员 也 会 偶尔 出 现 遗 漏 转换 类 型 符号 的 错误 ， 
比如 说 ， 用 了 %(lang) 而 不 是 正确 的 %(lang) s. 为 了 保证 字符 串 被 正确 的 转换 ， 程 序 员 必须 明确 
的 记 住 转换 类 型 参数 ， 比 如 到 底 是 要 转 成 字符 串 ， 整 数 还 是 其 他 什么 类 型 ， 















































新 式 的 字符 串 模板 的 优势 是 不 用 去 记 住 所 有 的 相关 细节 的 , 而 是 像 现在 shell 风格 的 脚本 
语言 里 面 那样 使 用 美元 符号 ($) 








由 于 新 式 的 字符 串 Template 对 象 的 引进 使 得 string 模块 又 重新 活 了 过 来 ，Template WR 
有 两 个 方法 , substitute () M safe substitute 0. 前 者 更 为 严谨 ,在 key 缺少 的 情况 下 它 会 报 一 
个 KeyError 的 异常 出 来 ， 而 后 者 在 缺少 key 时 ， 直 接 原 封 不 动 的 把 字符 串 显 示 出 来 . 




















2225 from string import Template 
2» s = Template( There are $íhowmany] $ílang] Quotation Symbols’) 
225 
2^ print s. substitute (lang= Python’, howmany=3) There are 3 Python Quotation 
Symbols 
225 
2» print s. substitute(lang-'Python') Traceback (most recent call last): 
File “stdin, line L in ? 
File “/usr/local/lib/python2. 4/string. py”, line 172, in substitute 
return self. pattern. sub(convert, self. template) 
File “/usr/local/lib/python2, 4/string. py”, line 162, in convert val = 
mapping [named] 
KeyError: 'howmany' 
225 
>»» print s. safe substitute (lang= Python’) There are $íhowmany] Python Quotation 
Symbols 


新 式 的 字符 串 模 板 是 从 Python2. 4 开始 加 入 的 ， 更 多 信息 请 查阅 Python 类 库 手 册 和 PEP 
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6.4.3 原始 字符 串 操作 符 ( r/R ) 


关于 原始 字符 串 的 目的 ， 在 Pythonl.5 里面 已 经 有 说 明 ， 是 为 了 对 付 那 些 在 字符 串 中 出 现 
的 特殊 字符 (下 面 的 小 节 会 介绍 这 些 特殊 字符 ) 。 在 原始 字符 串 里 ， 所 有 的 字符 都 是 直接 按照 字 
面 的 意思 来 使 用 ， 没 有 转 义 特殊 或 不 能 打印 的 字符 。 














原始 字符 串 的 这 个 特性 让 一 些 工作 变 得 非常 的 方便 , 比如 正则 表达 式 的 创建 ( 详 见 文档 的 re 
模块 ). 正则 表达 式 是 一 些 定义 了 高 级 搜索 匹配 方式 的 字符 串 , 通常 是 由 代表 字符 , 分 组 、 匹 配 信 
息 、 变 量 名 、 和 字符 类 等 的 特殊 符号 组 成 。 正 则 表达 式 模块 已 经 包含 了 足够 用 的 符号 。 但 当 你 
必须 插入 额外 的 符号 来 使 特殊 字符 表现 的 像 普通 字符 的 时 候 , 你 就 陷入 了 “字符 数字 ”的 泥潭 ! 
这 时 原始 字符 串 就 会 派 上 用 场 了 . 

除了 原始 字符 串 符 写 (引号 前 面 的 字母 “r“) 以 外 , 原始 字符 串 跟 普通 字符 串 有 着 几乎 完全 相 
同 的 语法 . 

这 个 'r 可 以 是 小 写 也 可 以 是 大 写 ， 唯 一 的 要 求 是 必须 紧 靠 在 第 一 个 引号 前 . 

在 三 个 例子 的 第 一 个 例子 里 面 ， 我 们 需要 一 个 反 斜 杜 加 一 个 "n 来 而 不 是 一 个 换行 符 . : 













































































po E d 
"Ag 


2 print "ia 


2 rn 

"pa" 

MP print r |n 
a 


接 下 来 的 例子 里 ， 我 们 打 不 开 我 们 的 README 文件 了 ， 为 什么 ? DN’ NC A r 被 当成 


不 在 我 们 的 文件 名 中 的 特殊 符号 ， 但 它们 实际 上 文件 路 径 的 中 4 个 独立 的 字符 . 


22^ f = open( C: \windows \ temp \readme. txt’, 'r') 
Traceback (most recent call last): 
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File stdin’, line l, in ? 

f = open( C: \windows\temp\readme. txt’, 'r' 

JOError: [Errno 2] No such file or directory: 'C:||win- dows||temp|readme. txt’ 
22» f = open(r' C: |windows|temp|readme. txt’, 'r' 

2» f. readline () 

'Table of Contents (please check timestamps for last update!) \n’ 
D>» f. close?) 








最 后 我 们 要 找 一 对 原始 的 \n 字符 而 不 是 换行 。 为 了 找到 它 ， 我 们 使 用 了 一 个 简单 的 正则 表 
达 式 ， 它 的 作用 是 查找 通常 被 用 来 表示 空白 字符 的 反 斜 线 -字符 对 (backslash-character 


pairs)» 








222 import re 
2» m = re.search( \\[rtfvn/’, r'Hello World! |n') 
25^ if m is not None: m. group Q 


2M» m = re. search(r’\\[rtfvn/]’, r' Hello World!\n’) 
25^ if m is not None: m. group Q 


| ia 


6.4.4 Unicode 字符 串 操 作 符 ( u/U ) 


Unocide 字符 串 操作 符 ， 大 写 的 QU) 和 小 写 的 (u) 是 在 Pythonl.6 中 和 Unicode 字符 串 一 
起 被 引入 的 ， 它 用 来 把 标准 字符 串 或 者 是 包含 Unicode 字符 的 字符 串 转 换 成 完全 地 Unicode 字 
符 串 对 象 。 关 于 Unicode 字符 串 的 进一步 信息 在 6. 7.4 节 有 详细 介绍 . 另外 , 字符 串 方法 ( 见 6. 6 
节 ) 和 正则 表达 式 引 擎 也 支持 Unicode. 下 面 是 几 个 例子 : 











v abc’ U*0061 U*0062  U*0063 
u' \ul234’ U+1234 
u abc\ul234\n — U*0061 U+0062 U+0063 U+1234 U+0012 





Unicode 操作 符 也 可 以 接受 原始 Unicode 字符 串 ， 只 要 我 们 将 Unicode 操作 符 和 前 面 讨论 
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dim 
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过 的 原始 字符 串 操 作 符 连接 在 一 起 就 可 以 了 .注意 :Unicode 操作 符 必 须 出 现在 原始 字符 串 操作 
符 前 面 . 















ur Hello\nWorld!’ 


6.5 内 建 函 数 
6.5.1 标准 类 型 函数 


cmp () 
同比 较 操 作 符 一 样 ， 内 建 的 cmp O 函数 也 根据 字符 串 的 ASCII 码 值 进行 比较 . 





2» strl = 'abc' 

2M» str2 = ° lmn’ 

222 str3 = xyz 

2» emp(strl, str2) 
三 /7 

2» emp(str3, strl) 
23 
2» emp(str2 "imn ) 
0 


6.5.2 序列 类 型 函数 


len() 


2 strl = Cabo" 

2» len(strl) 

J 

2» len( Hello World!) 

12 

正如 您 期 望 的 那样 , AER Len O 返回 字符 串 的 字符 数 . 





max() and min() 


>» ste? = ° lm’ 


dim 





二 一 —$— 一 人 


Edit By Vheavens 








Edit By Vheavens 





225 str3 = Xyz’ 
2^ max (str2) 
^p? 

22^ min(str3) 


P4 P4 


X 

虽然 max O 和 min O 函数 对 其 他 的 序列 类 型 可 能 更 有 用 ， 但 对 于 string 类 型 它们 能 很 好 地 
运行 ， 返 回 最 大 或 者 最 小 的 字符 ， (按照 ASCII 码 值 排列 ), 下 面 是 几 个 例子 : 

2» minl abl2cd') 

^p 

> min( ABIZCD’ ) 

^p 

2» min( ABabCDcd’ ) 

a 








enumerate () 


22> s = ’ foobar’ 

2» for i, t in enumerate(s): 
print i, t 

0 f 

lo 

20 

3b 


4a 
5r 


zipO 


A> s t= "Toa, '"obr 
2 xip(s t) 
[CE , o°), Co’, b’), Ca’, ue ur 





dim 





> -$ 


Edit By Vheavens 





Edit By Vheavens 





6.5.3 字符 串 类 型 函数 


raw input () 
内 建 的 raw input O 函数 使 用 给 定 字 符 串 提示 用 户 输入 并 将 这 个 输入 返回 ， 下 面 是 一 个 使 
用 raw input O 的 例子 : 














2» user input = raw input( Enter your name: ^) 
Enter your name: John Doe 

2 

222 user input 

' John Doe’ 

P» 

2^» len(user input) 

8 





Python 里 面 没有 C 风格 的 结束 字符 NUL, 你 输入 多 少 个 字符 ,len O 函数 的 返回 值 就 是 多 少 . 


str() and unicode() 

str() 和 unicode () 函数 都 是 工厂 函数 ， 就 是 说 产生 所 对 应 的 类 型 的 对 象 . 它们 接受 一 个 任 
意 类 型 的 对 象 , 然后 创建 该 对 象 的 可 打印 的 或 者 Unicode 的 字符 串 表 示 . 它们 和 basestring 都 
可 以 作为 参数 传 给 isinstance () 函数 来 判断 一 个 对 象 的 类 型 . 

















2» isinstance (u’ \OxAB’, str) 

False 

>»» not isinstance( foo’, unicode) 
True 

2» isinstance(u'', basestring) 

True 

2» not isinstance( foo', basestring) 
False 


chr(), unichr(), and ord() 
chr O 函数 用 一 个 范围 在 range (256) 内 的 (就 是 0 到 255) 整数 做 参数 , 返回 一 个 对 应 的 字 
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符 . unichr O) 跟 它 一 样 ， 只 不 过 返回 的 是 Unicode 字符 ， 这 个 从 Python2. 0 才 加 入 的 unichr O 
的 参数 范围 依赖 于 你 的 Python 是 如 何 被 编译 的 . 如 果 是 配置 为 USC2 的 Unicode， 那 么 它 的 允许 
范围 就 是 range(65536) 或 者 说 0x0000-0xFFFF; 如 果 配 置 为 UCS4， 那 么 这 个 值 应 该 是 
range (1114112) 或 者 0x000000-0x110000. 如 果 提 供 的 参数 不 在 允许 的 范围 内 , 则 会 报 一 个 
ValueError 的 异常 。 

ord( 函数 是 chr () 函数 (对 于 8 位 的 ASCII 字符 串 ) 或 unichr 0 函数 (对 于 Unicode 对 象 ) 
的 配对 函数 , 它 以 一 个 字符 (长 度 为 1 的 字符 串 ) 作为 参数 , 返回 对 应 的 ASCII 数值 ,或 者 Unicode 
数值 ,如 果 所 给 的 Unicode 字符 超出 了 你 的 Python 定义 范围 , 则 会 引发 一 个 TypeError 的 异常 。 








2» chr (65) 

ry? 

2 ord a 

97 
2^ unichr 12345) 

u’ |u3039* 

2M» chr (12345) 

Traceback (most recent call last): File “<stdin>”, line 1, in? 
chr (12345) 

ValueError: chr0 arg not in range (256) 
222 ord(u’ \uf fff’) 

Traceback (most recent call last): File “<stdin>”, line 1, in ? 
ord(u' |ufffff') 

TypeError: ord() expected a character, but string of length 2 found 
2 ord \G2345 7 
9029 


6.6 字符 串 内 建 函 数 
字符 串 方 法 是 从 Pythonl. 6 到 2. 0 慢 慢 加 进来 的 一 它们 也 被 加 到 了 Jython 中 . 这 些 方法 实 
现 了 string 模块 中 的 大 部 分 方法 , 表 6.6 列 出 了 目前 字符 串 内 建文 持 的 方法 ， 所 有 这 些 方法 都 
包含 了 对 Unicode 的 支持 ， 有 一 些 甚至 是 专门 用 于 Unicode ff. 























类 型 内 建 方法 
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方法 描述 
string. capitalize) ”把 字符 串 的 第 一 个 字符 大 写 
string. center (width) 返回 一 个 原 字符 串 居 中 , 并 使 用 空格 填充 至 长 度 width 的 新 字符 

















string. count (str, beg=0, 

end=len (string) ) 返回 str 在 string 里 面 出 现 的 次 数 ， 如 果 beg 或 者 end 指定 则 
返回 指定 范围 内 str 出 现 的 次 数 

string. decode (encoding=’ UTF-8’ , 














errors- strict’ ) 以 encoding 指定 的 编码 格式 解码 string， 如 果 出 错 默 认 报 一 个 
ValueError 的 异常 ， 除 非 errors 指定 的 是 "ignore” 或 者 
' replace’ 


string. encode (encoding-' UTF-8’ , 
errors? strict’ )* 以 encoding 指定 的 编码 格式 编码 string， 如 果 出 错 默认 报 一 个 


ValueError 的 异常 ,除非 errors 指定 的 是 ignore’ WE replace’ 











string. endswith(obj, beg=0, 
end=len (string))”“ 检 查 字 符 串 是 否 以 obj 结束 ， 如 果 beg 或 者 end 指定 则 检查 指 
定 的 范围 内 是 否 以 obj 结束 , 如 果 是 , 返回 True, 否则 返回 False. 
string. expandtabs (tabsize=8) 把 字符 串 string 中 的 tab 符号 转 为 空格 , 默认 的 空 
格 数 tabsize 是 8. 








string. find(str, beg=0, 














end=len (string) ) 检测 str 是 否 包含 在 string 中 ， 如 果 beg 和 end 指定 范围 ， 
则 检查 是 否 包含 在 指定 范围 内 ， 如 果 是 返回 开始 的 索引 值 ， 否 则 
返回 -1 

string. index(str, beg=0, 

end=len (string) ) BR findQ Jj iE — FE, 只 不 过 如 果 str HE string 中 会 报 一 个 异常 . 








string. isaluum0^ ^" RR string 至 少 有 一 个 字符 并 且 所 有 字符 都 是 字母 或 数字 则 返 
回 True, 否则 返回 False 
string. isalphaO^ ^* 如 果 string 至 少 有 一 个 字符 并 且 所 有 字符 都 是 字母 则 返回 True, 








否则 返回 False 





string. isdecimal )" ^ ° 如 果 string 只 包含 十 进 制 数 字 则 返回 True 否则 返回 False. 
string. isdigit O^ ° 如果 string 只 包含 数字 则 返回 True 否则 返回 False. 
string. islower Q^ ° 如 果 string 中 包含 至 少 一 个 区 分 大 小 写 的 字符 , 并 且 所 有 这 些 ( 区 分 





大 小 写 的 ) 字 符 都 是 小 写 ， 则 返回 True, AIK] False 
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string. isnumeric Q^ ^ ° 如 果 string 中 只 包含 数字 字符 ， 则 返回 True, AME] False 
string. isspace()” * 如 果 string 中 只 包含 空格 ， 则 返回 True, FURIE False. 
string. istitleQ” * 如 果 string 是 标题 化 的 ( 见 title0O) 则 返回 True， 否则 返回 False 
string. isupper O^ * 如果 string 中 包含 至 少 一 个 区 分 大 小 写 的 字符 , 并 且 所 有 这 些 ( 区 分 
大 小 写 的 ) 字符 都 是 大 写 ， 则 返回 True, FURE False 
string. join(seq) Merges (concatenates) 以 string 作为 分 隔 符 ， 将 seq 中 所 有 的 元 素 
(的 字符 串 表 示 ) 合并 为 一 个 新 的 字符 串 
string. ljust width) 返回 一 个 原 字符 串 左 对 齐 , 并 使 用 空格 填充 至 长 度 width 的 新 字符 串 
string.lower() 转换 string 中 所 有 大 写字 符 为 小 写 . 
string. 1strip() 截 掉 string 左边 的 空格 
string. partition (str) 有 点 像 findO 和 split O 的 结合 体 , 从 str 出 现 的 第 一 个 位 置 起 ， 
把 字符 串 string 分 成 一 个 3 元 素 的 元 组 
(string pre str,str,string post str), 如 果 string 中 不 包含 
str 则 string pre str == string. 






































string.replace(strl, str2, 
num-string.count(strl)) ff string 中 的 stri 替换 成 str2, 如 果 num 指定 ， 
则 替换 不 超过 num 次 . 
string.rfind(str, beg=0, end=len(string)) 类 似 于 find O 函数， 不 过 是 从 右边 开始 查 





string.rindex( str, beg=0, end-len(string)) 类 似 于 index 0 , 不 过 是 从 右边 开始 . 
string.rjust (width) 返 回 一 个 原 字符 串 右 对 齐 , 并 使 用 空格 填充 至 长 度 width 的 新 字符 串 





string.rpartition(str)' ”类 似 于 partition 0 函数 ,不 过 是 从 右边 开始 查找 . 
string. rstrip() 删除 string 字符 串 末 尾 的 空格 . 
string.split(str-"^, numestring.count(str)) 以 str 为 分 隔 符 切 片 string， 如 果 num 
有 指定 值 ， 则 仅 分 隔 nun 个 子 字 符 串 
string. splitlines (num=string. count C )) ”按照 行 分 隔 , 返回 一 个 包含 各 行 作为 元 素 
的 列表 , 如 果 num 指定 则 仅 切 片 num 个 
fT. 
string. startswith(obj, beg=0, end=len(string))” “检查 字符 串 是 否 是 以 obj FA, Æ 
返回 True， 人 否则 返回 Falses WR 
beg 和 end 指定 值 ， 则 在 指定 范围 内 





























aa Bi 
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dim 
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SÉ. 
string. strip([obj]) 在 string EFF I1stripO M rstripO 
string. swapcase() 翻转 string 中 的 大 小 写 
string. title)” * 返回 “标题 化 “的 string, 就 是 说 所 有 单词 都 是 以 大 写 开 始 ， 其 余 
字母 均 为 小 写 ( 见 istitleO) 
string. translate(str, del-^^) 根据 str 给 出 的 表 ( 包 含 256 个 字符 ) 转换 string 的 字符 ， 
要 过 滤 掉 的 字符 放 到 del 参数 中 
string. upper() 转换 string 中 的 小 写字 母 为 大 写 
string. zfill(width) 返回 长 度 为 width 的 字符 串 , REA string 右 对 齐 ， 前 面 填 充 





pm 





a. Pythonl. 6 中 只 适用 于 Unicode 字符 串 ，2. 0 中 适用 于 所 有 字符 日 
b. 1.5.2 ARASH string 模块 没有 该 方法 
c. 在 Jython2.1 有 
d. fJ Unicode 字符 串 有 效 ， 

e. Python2. 5 或 者 以 上 版 本 














几 个 使 用 字符 串 方法 的 例子 : 


2» quest = "what is your favorite color?’ 
22» quest. capitalize() 

"What is your favorite color?’ 

222 

>> quest. center (40) 

' phat is your favorite color? 
222 

22» quest. count ( or’) 

2 

2252 

>> quest. endswith( blue’) False 
222 

>> quest. endswith( color?) True 
222 

22» quest.find( or’, 30) 

x 


dim 
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222 
22» quest. find( or’, 22) 
25 
22 
22» quest. index( or’, 10) 
16 


222 

2205 "r5, join (Quest. split O) 
"what:is:your:favorite:color?' 

22» quest. replace( favorite color’, 'quest') 
222 

"what is your quest?’ 

222 

22» quest. upper () 

° WHAT IS YOUR FAVORITE COLOR?’ 


上 面 最 复杂 的 例子 是 有 split 0 和 join O RARA. 首先 我 们 在 string 上 调用 splitO 
函数 , 没有 用 参数 ， 也 就 是 说 以 空格 作为 分 隔 符 分 隔 字 符 串 ， 然 后 我 们 以 这 个 包含 单词 的 列表 
做 参数 调用 join () 方 法 把 这 些 单词 用 一 个 新 的 分 隔 符 冒号 重新 串 在 一 起 ， 注 意 ， 我 们 首先 用 
split (函数 把 string 切片 成 一 个 列表 , 然后 我 们 在 字符 串 : 上 应 用 join 0 方法 把 这 个 列表 
重新 连接 成 一 个 字符 串 . 


6.7 字符 串 的 独特 特性 
6.7.1 特殊 字符 串 和 控制 字符 


像 其 他 高 级 语言 和 脚本 语言 一 样 , 一 个 反 斜 线 加 一 个 单一 字符 可 以 表示 一 个 特殊 字符 , 通常 
是 一 个 不 可 打印 的 字符 ， 这 就 是 我 们 上 面 讨论 的 特殊 字符 ， 如 果 这 些 特殊 字符 是 包含 在 一 个 原 
台 字 符 串 中 的 ， 那 么 它 就 失去 了 转 义 的 功能 . 






































除了 通常 用 的 特殊 字符 ， 比 如 换行 符 (\n) , tab 符 (\t) 之 外 ， 也 可 以 直接 用 ASCII 码 值 来 标 
示 特 殊 字符 :\000 或 者 \xXX， 分 别 对 应 字符 的 八进制 和 十 六 进 制 ASCII 码 值 ， 下 面 分 别 是 十 进 
制 ， 八 进 制 和 十 六 进 制 的 0, 65, 和 255: 














ASCII ASCII ASCII 
Decimal 0 65 255 


E 


dim 
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Octal N000 MOI MITT 
Hexadecimal \x00 \x41 \xFF 


特殊 字符 ， 包 括 反 和 斜 杠 转 义 的 那些 都 可 以 像 普通 字符 一 样 存储 到 Py thon 的 字符 串 中 . 


跟 C 字 符 串 的 男 一 个 不 同 之 处 是 Python 的 字符 串 并 不 是 以 NUL (4000) 作为 结束 符 的 . NUL 跟 
其 他 的 反 和 斜 杠 转 义 字符 没什么 两 样 . 事实 上 , 一 个 字符 串 中 不 仅 可 以 出 现 NUL 字符 ,而 且 还 可 以 
出 现 不 止 一 次 , 在 字符 串 的 任意 位 置 都 可 以 。 表 6.7 列 出 了 被 大 部 分 Python 版 本 支持 的 转 义 字 
符 . 
如 上 所 述 ， 就 像 使 用 连 字符 来 让 一 行 的 内 容 持 续 到 下 一 行 一 样 ， 可 以 用 显 式 定 义 八 进 制 
或 者 十 六 进 制 的 ASCII 码 的 方式 定义 特殊 字符 , 合法 的 ASCII 码 值 范围 是 从 0 到 255 (八进制 的 
是 0177, 十 六 进 制 是 OXFF) . 














Table 6.7 上 反 斜 本 开头 的 转 义 字符 

















/X 八进制 — 十进制 ”十 六 进 制 ”字符 说明 

X0 000 0 0x00 NUL FIF Nul 
\a 007 7 0x07 BEL 响 铃 字符 
\b 010 8 0x08 BS 退 格 

\t oll 9 0x09 HT 横向 制 表 符 
\n 012 10 Ox0A LF 换行 

Ww 013 11 0x0B VT ”纵向 制 表 符 
\f 014 12 0x0C FF KK 

Ww O15 13 0x0D CR HÆ 

\e 033 27 Ox1B ESC RX 

\ 042 34 0x22 “MSS 

\ 047 39 0x27 ' — BLS 

\\ 134 92 0x5C N Soe AL 


\000 八进制 值 (范围 是 000 到 0177) 
\xXX x 打头 的 十 六 进 制 值 (范围 是 0x00 到 OxFF) 
\ 连 字符 ， 将 本 行 和 下 一 行 的 内 容 连 接 起 来 . 








E 





dim 
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空 制 字符 的 一 个 作用 是 用 做 字符 串 里 面 的 定 界 符 , 在 数据 库 或 者 web 应 用 中 ,大 多 数 的 可 
打印 字符 都 是 被 允许 用 在 数据 项 里 面 的 ， 就 是 说 可 打印 的 字符 不 适合 做 定 界 符 . 

用 可 打印 的 字符 串 比 如 冒号 (:) 来 作 定 界 符 ， 将 会 很 难 分 辨 一 个 字符 到 底 是 数据 还 是 定 
界 符 . 而 且 还 会 限定 你 能 用 在 数据 项 里 面 的 字符 数量 ， 而 这 不 是 你 想 要 的 

一 个 通常 的 解决 方案 是 ， 使 用 那些 不 经 常 使 用 的 ， 不 可 打印 的 ASCII 码 值 来 作为 定 界 符 ， 
它们 是 非常 完美 的 定 界 符 ， 这 样 一 来 诸如 冒号 这 样 的 可 打印 字符 就 可 以 解脱 出 来 用 在 数据 项 中 





















































6.7.2 三 引号 





虽然 你 可 以 用 单 引号 或 者 双 引 号 来 定义 字符 串 ， 但 是 如 果 你 需要 包含 诸如 换行 符 这 样 的 特 
殊 字 符 时 ， 单 引号 或 者 双 引 号 就 不 是 那么 方便 了 。Python 的 三 引号 就 是 为 了 解决 这 个 问题 的 ， 
它 允 许 一 个 字符 串 跨 多 行 ， 字 符 串 中 可 以 包含 换行 符 、 制 表 符 以 及 其 他 特殊 字符 . 

三 引号 的 语法 是 一 对 连续 的 单 引 号 或 者 双 引 号 (通常 都 是 成 对 的 用 ) : 



































2 hi =~" hi there?’ 
2285 hi # repr 
"hi \nthere’ 
2 print hi # str 
hi there 











三 引号 让 程序 员 从 引号 和 特殊 字符 串 的 泥潭 里 面 解脱 出 来 ， 自 始 至 终 保持 一 小 块 字符 串 的 
格式 是 所 谓 的 WSIWYG (所 见 即 所 得 ) 格 式 的 。 

一 个 典型 的 用 例 是 ， 当 你 需要 一 块 HTML 或 者 SQL 时 ， 这 时 用 字符 串 组 合 ， 特 殊 字 符 串 转 义 
将 会 非常 的 繁琐 ， 





errHTML = ''* 
<HTML><HEAD<TITLE> 
Friends CGI Demo</TITLE></HEAD 


<BODY><H3>ERROR</H3> 

Bhs C BP 

<FORID <INPUT TYPE-button VALUE=Back 
ONCLICK-^window. history. back O </FORM> 
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dim 
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C BODY^C/ HTML» 


233 


3222 


cursor. execute ( 
CREATE TABLE users ( 

login VARCHAR(S), uid INTEGER, 
prid INTEGER) 

n) 


6.7.3 字符 串 不 变性 


在 第 4.7.2 节 里 面 ， 我 们 讨论 了 字符 串 是 一 种 不 可 变数 据 类 型 ， 就 是 说 它 的 值 是 不 能 被 改 
变 或 修改 的 。 这 就 意味 着 如 果 你 想 修 改 一 个 字符 串 ， 或 者 截取 一 个 子囊 ， 或 者 在 字符 串 的 末尾 
连接 男 一 个 字符 串 等 等 ， 你 必须 新 建 一 个 字符 串 。 

这 听 起 来 要 比 实际 情况 复杂 . 因为 Python 蔡 你 管理 内 存 ， 你 根本 不 需要 知道 到 底 发 生 了 什 
么 ， 每 次 你 修改 一 个 字符 串 或 者 做 一 些 改变 字 符 串 内 容 的 操作 时 ，Python 都 会 自动 为 你 分 配 
一 个 新 串 . 在 下 面 的 例子 里 面 ，Python 分 别 为 "abc“ 和 ”def “分配 了 空间 , 当 进 行 连接 操作 时 ， 
Python 自动 为 新 的 字符 串 “abcdef 分 配 了 空间 















































222 abc’ + 'def' 
'abcdef" 


给 变量 赋值 是 没什么 不 同 : 


2 s "ala 
BASE =s + “der 
2> s 

’ abede f? 


上 面 的 例子 里 ， 看 起 来 是 我 们 先 把 "abc 赋 给 了 s， 然 后 在 s 的 末尾 添加 了 ^ def”. 这样 看 起 
来 字符 串 似 乎 是 可 变 的 , 其 实事 实 是 在 “s+' def 这 个 操作 进行 的 时 候 ， 新 建 了 一 个 新 字符 串 ， 
然后 这 个 新 的 对 象 被 赋 给 了 s， 原 来 的 字符 串 abc 被 析 构 掉 了 . 
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我 们 可 以 用 idO 函数 来 更 明显 的 显示 出 来 到 底 发 生 了 什么 . 复习 一 下 ，id() 函数 返回 一 个 
对 象 的 身份 , 这 个 概念 有 点 类 似 于 “内 存 地 址 ”。 


» s = aba 
225 

225 id(s) 
135060856 

225 

222 s t= ae 
22» id(s) 
135057968 











注意 修改 前 后 的 身份 是 不 同 的 . 另 一 个 测试 是 针对 字符 串 的 一 个 字符 或 者 一 个 子 串 所 做 的 
修改 . 我 们 现在 将 展示 对 字符 串 的 一 个 字符 或 者 一 片 字符 的 改动 都 是 不 被 允许 的 : 





2s 

"abcdef"* 

222 

2A» s[2] 2'C 

Traceback (innermost last): 
File “<stdim>”’, line L in ? AttributeError: | setitem . 
222 
2» s[3:6] = 'DEF' 
Traceback (innermost last): 
File “<stdin)”, line L in ? 
AttributeError: | setslice _ 














两 个 操作 都 抛 出 了 有 异常. 为 了 实现 要 求 ， 我 们 需要 用 现 有 字符 串 的 子 串 来 构建 一 个 新 串 , 然 
后 把 这 个 新 串 赋 给 原来 的 变量 : 








> s 
'abcdef" 

2 

M9 s = MsCYs % (s[0:2], s[3:]) 
2998 





二 一 —o— — 


Edit By Vheavens 











T 


* 
e 


t 





Edit By Vheavens 





'abCdef"* 

225 

po? s[0:3] + UBER 
’ abCDEF’ 


对 像 字符 串 这 样 的 不 可 变 对 象 , RIRA T E EERE "PBA Zc TAY PRR 











il, 左 值 必须 是 一 


个 完整 的 对 象 ， 比 如 说 一 个 字符 串 对 象 ， 不 能 是 字符 串 的 一 部 分 . 对 赋值 操作 的 右 值 没有 这 个 限 


iil). 





6.8 Unicode 


从 Pythonl. 6 起 引进 的 Unicode 字符 串 支 持 , 是 用 来 在 多 种 双 

















字 节 字符 的 格式 、 编 码 进行 转 


一 


换 的 , 其 中 包括 一 些 对 这 类 字符 串 的 操作 管理 功能 。 内 建 的 字符 串 和 正则 表达 式 对 Unicode 字符 





串 的 支持 ， 再 加 上 string 模块 的 辅助 ，Python 已 经 可 以 应 付 大 部 分 应 用 对 Unicode 的 存储 、 





访问 、 操 作 的 需要 了 。 我 们 会 尽 最 大 的 努力 把 Python 对 Unicode 


的 支持 说 清楚 ， 


让 我 们 先 讨论 一 些 基本 的 术语 ， 然 后 问 一 下 自己 ， 到 底 什么 是 Unicode? 


6. 8.1 术语 


Table 6.8 Unicode 术语 





名 词 意思 

ASCII 美国 标准 信息 交换 码 

BMP 基本 多 文 种 平面 (第 零 平 面 ) 

BOM 字 节 顺序 标记 (标识 字 节 顺序 的 字符 ) 


CJK/CJKV 中文- 日文 -韩文 (和 越南 语 ) 的 缩写 


但 在 这 之 前 ， 


Code point (WF ASCII 值 ， 代 表 Unicode 字符 的 值 ， 范 围 在 range (1114112) 或 者 说 


0x000000 到 Ox LOFFFF. 








Octet 八 位 二 进 制 数 的 位 组 

UCS 通用 字符 集 

UCS2 UCS 的 双 字 节 编 码 方式 ( 见 UTF-16) 

UCS4 UCS 的 四 字 节 编码 方式 . 

UTF Unicode 或 者 UCS 的 转换 格式 . 

UTF-8 ” 八 位 UTF 转换 格式 (无 符号 字 节 序列 ， 长 度 为 一 到 四 个 字 节 ) 


+- > 





Edit By Vheavens 





e+ 


Edit By Vheavens 


-e| 





T 


UTF-16 16 fiz UTF 转换 格式 (无 符号 字 节 序列 ， 通 常 是 16 位 长 [两 个 字 节 ]， 见 UCS2) 





6. 8.2 什么 是 Unicode? 





Unicode 是 计算 机 可 以 支持 这 个 星球 上 多 种 语言 的 秘密 武器 .在 Unicode 之 前 ， 用 的 都 是 
ASCII, ASCII 码 非 常 简单 ， 每 个 英文 字符 都 是 以 七 位 二 进 制 数 的 方式 存 贮 在 计算 机 内 , 其 范围 
是 32 到 126. 当 用 户 在 文件 中 键入 一 个 大 写字 符 A 时 ， 计 算 机 会 把 A 的 ASCII 码 值 65 

写 入 磁盘 , 然后 当 计 算 机 读 取 该 文件 时 ， 它 会 首先 把 65 转化 成 字符 A 然后 显示 到 屏幕 上 . 














ASCII 编码 的 文件 小 巧 易 读 。 一 个 程序 只 需 简 单 地 把 文件 的 每 个 字 节 读 出 来 ， 把 对 应 的 数 
值 转换 成 字符 显示 出 来 就 可 以 了 . 但 是 ASCII 字 符 只 能 表示 95 个 可 打印 字符 . 后 来 的 软件 厂商 把 
ASCII 码 扩展 到 了 8 位 ， 这 样 一 来 它 就 可 以 多 标识 128 个 字符 , 可 是 223 个 字符 对 需要 成 千 上 万 
的 字符 的 非 欧洲 语系 的 语言 来 说 仍然 太 少 

Unicode 通过 使 用 一 个 或 多 个 字 节 来 表示 一 个 字符 的 方法 突破 了 ASCII 的 限制 ， 在 这 样机 
制 下 ，Unicode 可 以 表示 超过 90, 000 个 字符 . 


$ 6.8.3 你 是 怎么 用 Unicode 的 ? E: 


Hb, Python 只 能 处 理 8 位 的 ASCII 值 , 字符 串 就 是 简单 的 数据 类 型 ， 为 了 处 理 一 个 字符 
E, 用 户 必 须 首 先 创建 一 个 字符 串 , 然后 把 它 作 为 参数 传 给 string 模块 的 一 个 函数 来 处 理 . 2000 
^E, Pythonl. 6( 和 2.0) 版 释 出 , Unicode 第 一 次 在 Python 里 面 得 到 了 支持 . 



























































为 了 让 Unicode 和 ASCII 码 值 的 字符 串 看 起 来 尽 可 能 的 相像 ,Python 的 字符 串 从 原来 的 简 
单数 据 类 型 改 成 了 真正 的 对 象 .ASCIT 字符 串 成 了 StringType， 而 Unicode 字符 串 成 了 
UnicodeType 类 型 . 它们 的 行为 是 非常 相近 的 . string 模块 里 面 都 有 相应 的 处 理 函 数 . string 模 
块 已 经 停止 了 更 新 ， 只 保留 了 ASCII 码 的 支持 , string 模块 已 经 不 推荐 使 用 , 在 任何 需要 跟 
Unicode 兼容 的 代码 里 都 不 要 再 用 该 模块 ，Python 保留 该 模块 仅仅 是 为 了 向 后 兼容 。 
































Python 里 面 处 理 Unicode 字符 串 跟 处 理 ASCII 字符 串 没 什么 两 样 . Python 把 硬 编码 的 字符 
串 叫 做 字面 上 的 字符 串 , 默认 所 有 字面 上 的 字符 串 都 用 ASCII 编码 , 可 以 通过 在 字符 串 前 面 加 一 
个 "uw WRAAE H Unicode 字符 串 ,这 个 'u 前 级 告诉 Python 后 面 的 字符 串 要 编码 成 Unicode 


一 


字符 串 . 
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2» “Hello World” # ASCII string 
2»» u'Hello World” # Unicode string 





内 建 的 str0 函数 和 chr O 函数 并 没有 升级 成 可 以 处 理 Unicode. 它们 只 能 处 理 常 规 的 
ASCII 编码 字符 串 , 如 果 一 个 Unicode 字符 串 被 作 作为 参数 传 给 了 str 0 函数， 它 会 首先 被 转换 
成 ASCII 字符 串 然 后 在 交 给 str O 函数 . 如 果 该 Unicode 字符 串 中 包含 任何 不 被 ASCII 字符 串 支 
持 的 字符 ， 会 导致 str 0 函数 报 异 常 . 同样 地 , chr O 函数 只 能 以 0 到 255 作为 参数 工作 . 如 果 你 
传 给 它 一 个 超出 此 范围 的 值 (比如 说 一 个 Unicode 字符 ), 它 会 报 异 常 . 

3er HJ P] EAM unicode O J unichar O 可 以 看 成 Unicode WÆKI str O M chr 0. Unicode 0 
函数 可 以 把 任何 Python 的 数据 类 型 转换 成 一 个 Unicode 字符 串 , 如 果 是 对 象 ， 并 且 该 对 象 定义 
了 _unicode 0 方法 ， 它 还 可 以 把 该 对 象 转换 成 相应 的 Unicode 字符 串 . 具体 内 容 见 6. 1. 3 和 
6.5.3 章节 . 



































6.8.4 Codecs 是 什么 ? 











种 用 一 个 字 节 把 字符 转换 成 数字 的 方式 不 同 , Unicode 用 的 是 多 字 节 . 这 导致 了 Unicode 支持 多 
种 不 同 的 编码 方式 . 比如 说 codec 支持 的 四 种 耳熟能详 的 编码 方式 是 :ASCIL ISO 
8859-1/Latin-1, UTF-8 和 UTF-16. 


codec 是 COder/DECoder WH BRAG. 它 定 义 了 文本 跟 二 进 制 值 的 转换 方式 , 跟 ASCII 那 

















中 最 著名 的 是 UTF-8 编 码 , 它 也 用 一 个 字 节 来 编码 ASCII 字 符 , 这 让 那些 必须 同时 处 理 ASCII 
码 和 Unicode 码 文本 的 程序 员 的 工作 变 得 非常 轻松 ， 因 为 ASCII 字符 的 UTF-8 编码 跟 ASCII 编 
码 完全 相同 。 











UTF-8 编码 可 以 用 1 个 到 4 个 字 节 来 表示 其 他 语言 的 字符 , CJK/East 这 样 的 东亚 文字 一 般 都 
是 用 3 个 字 节 来 表示 ， 那 些 少 用 的 、 特 殊 的 、 或 者 历史 遗留 的 字符 用 4 个 字 节 来 表示 . 这 给 那些 
需要 直接 处 理 Unicode 数据 的 程序 员 带 来 了 麻烦 ， 因 为 他 们 没有 办 法 按照 固定 长 度 逐 一 读 出 各 
个 字符 . 幸运 的 是 我 们 不 需要 掌握 直接 读 写 Unicode 数据 的 方法 ，Python 已 经 替 我 们 完成 了 相 
关 细 节 ， 我 们 无 须 为 处 理 多 字 节 字符 的 复杂 问题 而 担心 . Python 里 面 的 其 他 编码 不 是 很 常用 ， 
事实 上， 我 们 认为 大 部 分 的 Python 程序 员 根本 就 用 不 着 去 处 理 其 他 的 编码 ，UTF-16 可 能 是 个 
例外 . 


E 


















































UTF-16 可 能 是 以 后 大 行 其 道 的 一 种 编码 格式 ， 它 容易 读 写 ， 因 为 它 把 所 有 的 字符 都 是 用 单 
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独 的 一 个 16 位 字 , 两 个 字 节 来 存储 的 ， 正 因为 此 , 这 两 个 字 节 的 顺序 需要 定义 一 下 ， 一 般 的 
UTF-16 编码 文件 都 需要 一 个 BOM(Byte Order Mark) ， 或 者 你 显 式 地 定义 UTF-16-LE Chii) 或 
者 UTF-16-BE( 大 端 ) 字 节 序 . 














从 技术 上 讲 ，UTF-16 也 是 一 种 变 长 编码 , 但 它 不 是 很 常用 (人 们 一 般 不 会 知道 或 者 根本 不 
企 意 除了 基本 多 文 种 平面 BMP 之 外 到 底 使 用 的 是 那 种 平面 ), 尽管 如 此 ，UTF-16 并 不 同 后 兼容 
ASCII, 因此 ， 实 现 它 的 程序 很 少 ， 因 为 大 家 需要 对 ASCII 进行 支持 。 


6.8.5 编码 解码 


Unicode 文 持 多 种 编码 格式 ， 这 为 程序 员 带 来 了 额外 的 负担 , 每 当 你 向 一 个 文件 写 入 字符 
串 的 时 候 ， 你 必须 定义 一 个 编码 (encoding 参数 ) 用 于 把 对 应 的 Unicode 内 容 转换 成 你 定义 的 格 
XX, Python 通过 Unicode 字符 串 的 encode O 函数 解决 了 这 个 问题 ， 该 函数 接受 字符 串 中 的 字符 
为 参数 ， 输 出 你 指定 的 编码 格式 的 内 容 。 



































相应 地 , 当 我 们 从 这 个 文件 读 取 数 据 时 , 我 们 必须 ”解码 ”该 文件 , 使 之 成 为 相应 的 Unicode 字符 


所 以 , 每 次 我 们 写 一 个 Unicode 字符 串 到 磁盘 上 我 们 都 要 用 指定 的 编码 器 给 他 ”编码 “一 下 ， 
FB XY S 


简单 的 例子 





下 面 的 代码 创建 了 一 个 Unicode 字符 串 ,用 UTF-8 编码 器 将 它 编码 , 然后 写 入 到 一 个 文件 中 
去 . 接着 把 数据 从 文件 中 读 回 来 , 解码 成 Unicode 字符 串 对 象 . 最 后 ,打印 出 Unicode 字符 串 ， 用 
以 确认 程序 正确 地 运行 . 








~ 


























逐 行 解释 


第 1-7 fT 
像 通常 一 样 ， 首 先 定 义 了 doc 字符 串 和 用 以 表示 解码 器 的 常量 ， 还 有 用 以 存储 字符 串 的 文 
件 名 . 





第 9-19 行 
我 们 创建 了 一 个 Unicode 字符 串 , 用 我 们 指定 的 编码 格式 对 其 进行 编码 , 然后 把 它 写 入 到 文 
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件 中 去 , (9-13 47), 接着 我 们 把 内 容 从 文件 中 重新 读 出 来 ， 解 码 ， 显 示 到 屏幕 上 ， 输 出 的 时 候 去 
掉 print 的 自动 换行 ， 因 为 我 们 已 经 在 字符 串 中 写 了 一 个 换行 符 (15-19 行 ). 








例 6.2 简单 Unicode 字符 串 例子 (uniFile. py) 


这 个 简单 的 例子 中 ， 我 们 把 一 个 Unicode 字符 串 写 入 到 磁盘 文件 ， 然 后 再 把 它 读 出 并 显示 
出 来 。 写 入 的 时 候 用 UTF-8 编码 , 读 出 也 一 样 ， 用 UTF-8. 


7 #//usr/bin/env python 
2" 
3 An example of reading and writing Unicode strings:Writes 
4 a Unicode string to a file in utf-8 and reads itback in. 
Pa 
6 CODEC = '"utf-8' 
7 FILE = unicode. txt’ 
8 
9 hello out = uHello worid|n^ 
10 bytes out = hello out. encode (CODEC) 
11 f = open (FILE, ^w^) 
12 f. write (bytes_out) 
13 f. close() 
14 
15 f = open (FILE, tr^) 
16 bytes in = f. read 
17 f. close 0 
18 hello in = bytes in. decode (CODEC) 
19 print hello in, 


运行 该 程序 ， 我 们 得 到 如 下 的 输出 : 


$ unicode example. py 
Hello World 


在 文件 系统 中 也 会 发 现 一 个 叫 unicode. txt 的 文件 ， 里 面包 含 跟 输 出 的 内 容 一 致 的 数据 . 


$ cat unicode. txt 
Hello World! 
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简单 Web 例子 
在 第 20 章 Web 编程 里 面 我 们 展示 了 一 个 简单 的 在 CGI 应 用 中 使 用 Unicode 的 例子 . 


6.8.6 把 Unicode 应 用 到 实际 应 用 中 











这 些 处 理 Unicode 字符 串 的 例子 简单 到 让 人 感到 有 点 假 , 事实 上 , 只 要 你 遵守 以 下 的 规则 ， 
处 理 Unicode 就 是 这 么 简单 : 














程序 中 出 现 字 符 串 时 一 定 要 加 个 前 级 u. 
不 要 用 str 0 函数， 用 unicode 0 RË. 
不 要 用 过 时 的 string 模块 -- 如 果 传 给 它 的 是 非 ASCII 字符 ， 它 会 把 一 切 搞 砸 。 
不 到 必须 时 不 要 在 你 的 程序 里 面 编 解码 Unicod 字符 . 只 在 你 要 写 入 文件 或 数据 库 或 者 
网 络 时 , 才 调用 encode O 函数 ;相应 地 , 只 在 你 需要 把 数据 读 回 来 的 时 候 才 调用 decode () 





























这 些 规 则 可 以 规避 90% 由 于 Uni code 字符 串 处 理 引 起 的 bug. 现在 的 问题 是 剩 下 的 10% 的 问 

题 却 让 你 处 理 不 了 ， 笠 亏 Python 提供 了 大 量 的 模块 、 库 来 蔡 你 处 理 这 些 问题 . 它们 可 以 让 你 用 

10 íF Python 语句 写 出 其 他 语言 需要 100 行 语句 才能 完成 的 功能 ， 但 是 相应 地 ， 对 Unicode x: 
持 的 质量 也 完全 取决 于 这 些 模 块 、 库 . 









































Python 标准 库 里 面 的 绝 大 部 分 模块 都 是 兼容 Unicode 的 .除了 pickle 模块 1pickle 模块 只 
支持 ASCIT 字符 串 。 如 果 你 把 一 个 Unicode 字符 串 交 给 pickle 模块 来 unpickle, 它 会 报 异 常 . 
你 必须 先 把 你 的 字符 串 转换 成 ASCII 字符 串 才 可 以 . 所 以 最 好 是 避免 基于 文本 的 pickle 操作 . 
幸运 地 是 现在 二 进 制 格 式 已 经 作为 pickle 的 默认 格式 了 ，pickle 的 二 进 制 格式 支持 不 错 . 这 点 
在 你 向 数据 库 里 面 存 东西 是 尤为 突出 ,把 它们 作为 BLOB 字段 存储 而 不 是 作为 TEXT 或 者 VARCHAR 
字段 存储 要 好 很 多 . 万 一 有 人 把 你 的 字段 改 成 了 Unicode 类 型 ， 这 可 以 避免 pickle MAAK. 






































如 果 你 的 程序 里 面 用 到 了 很 多 第 三 方 模块 ， 那 么 你 很 可 能 在 各 个 模块 统一 使 用 Unicode 通 
讯 方面 遇 到 麻烦 ，Unicode 还 没 成 为 一 项 必须 的 规定 ， 在 你 系统 里 面 的 第 三 方 模块 (包括 你 的 应 
用 要 面 对 的 平台 \ 系 统 ) 需要 用 相同 的 Unicode 编码 ， 否 则 ， 可 能 你 就 不 能 正确 的 读 写 数据 . 

作为 一 个 例子 ， 假 设 你 正在 构建 一 个 用 数据 库 来 读 写 Unicode 数据 的 Web 应 用 . 为 了 文 持 
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Unicode， 你 必须 确保 以 下 方面 对 Unicode 的 支持 : 





e 数据库 服务 器 (MySQL, PostgreSQL, SQL Server, 等 等 
e 数据 库 适 配器 (MySQLdb 等 等 
@ Web 开发 框架 (mod python, cgi, Zope, Plane, Django 等 等 

















数据 库 方 面 最 容易 对 付 ， 你 只 要 确保 每 张 表 都 用 UTF-8 编码 就 可 以 了 。 








数据 库 适 配器 可 能 有 点 麻烦 ， 有 些 适 配器 支持 Unicode 有 些 不 支持 , 比如 说 MySQLdb, 它 并 

不 是 默认 就 支持 Unicode 模式 , 你 必须 在 connect 0 方法 里 面 用 一 个 特殊 的 关键 字 use unicode 
来 确保 你 得 到 的 查询 结果 是 Unicode 字符 串 . 

mod python 里 面 开 启 对 Unicode 的 支持 相当 简单 ,只 要 在 request 对 象 里 面 把 

text-encoding 一 项 设 成 "utf-8 “就 行 了 ， 剩 下 的 mod python 都 会 蔡 你 完成 ，Zope 等 其 他 复杂 
的 系统 可 能 需要 更 多 的 工作 来 支持 Unicode. 


6.8.7 ”从 现实 中 得 来 的 教训 


失误 机 : 你 必须 在 一 个 极 有 限 的 时 间 内 写 出 一 个 大 型 的 应 用 , 而 且 需 要 其 他 语言 的 支持 ， 
但 是 产品 经 理 并 没有 明确 定义 这 一 点 。 你 并 没有 考虑 Unicode 的 兼容 , 直到 项 目 快要 结束 ... , 
这 时 候 再 添加 Unicode 的 支持 几乎 不 太 可 能 ， 不 是 吗 ? 
结果 S1: 没 能 预测 到 最 终 用 户 对 其 他 语言 界面 的 需求 , 在 集成 他 们 用 的 面向 其 他 语种 的 应 
用 时 又 没有 使 用 Unicode 支持 . 更 新 整个 系统 既 让 让 人 觉得 档 燥 和 更 是 浪费 时 间 。 













































































失误 要 :在 源码 中 到 处 使 用 string 模块 或 者 str 0 和 chr 0 函数. 

结果 要 :通过 全 局 的 查找 替换 把 str OI chr O BHR unicode O 和 unichr O , 但 是 这 样 一 
来 很 可 能 就 不 能 再 用 pickle 模块 ， 要 用 只 能 把 所 有 要 pickle 处 理 的 数据 存 成 二 进 制 形式 ， 这 
样 一 来 就 必须 修改 数据 库 的 结构 ， 而 修改 数据 库 结构 就 意味 着 全 部 推倒 重 来 . 






































失误 83: 不 能 确定 所 有 的 辅助 系统 都 完全 地 支持 Unicode. 
结果 H3: 不 得 不 去 为 那些 系统 打 补 丁 ， 而 其 中 有 些 系 统 可 能 你 根本 就 没有 源码 . 修复 对 
Unicode 支持 的 bug 可 能 会 降低 代码 的 可 靠 性 ， 而 且 非 常 有 可 能 引入 新 的 bug. 











总 结 : 使 应 用 程序 完全 文 持 Unicode， 兼 容 其 他 的 语言 本 号 就 是 一 个 工程 . 
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它 需 要 详细 的 考虑 、 计 划 . 所 有 涉及 到 的 软件 、 系 统 都 需要 检查 ， 包括 Python 的 标准 库 和 其 
他 将 要 用 到 的 第 三 方 扩展 模块 . 你 甚至 有 可 能 需要 组 建 一 个 经 验 丰 富 的 团队 来 专门 负责 国际 化 
(I18N) 问题 

















6.8.8 Python 的 Unicode 支持 


内 建 的 unicode O 函数 
Unicode 的 工厂 方法 ， 同 Unicode 字符 串 操 作 符 (u / U) 的 工作 方式 很 类 似 ， 它 接受 一 个 
string 做 参数 ， 返 回 一 个 Unicode 字符 串 . 





内 建 的 decode () /encode () 方 法 

decode () 和 encode () 内 建 函 数 接受 一 个 字符 串 做 参数 返回 该 字符 串 对 应 的 解码 后 /编码 后 
的 字符 串 . decode () 和 encode () 都 可 以 应 用 于 稼 规 字 符 串 和 Unicode 字符 串 . decode () 方 法 是 在 
Python2. 2 以 后 加 入 的 . 


Unicode 类 型 
Unicode 字符 串 对 象 是 basestring 的 子 类 、 用 Unicode 0 工厂 方法 或 直接 在 字符 串 前 面 加 
一 个 u 或 者 U 来 创建 实例 . 支持 Unicode 原始 字符 串 , 只 要 在 你 的 字符 串 前 面 加 一 个 ur 或 者 UR 


就 可 以 了 . 






































Unicode 序数 
标准 内 建 函 数 ordO 工作 方式 相同 ， 最 近 已 经 升级 到 可 以 支持 Unicode 对 象 了 。 内 建 的 
unichr () 函数 返回 一 个 对 应 的 Uni code 字符 (需要 一 个 32 位 的 值 ) ;否则 就 产生 一 个 ValueError 


异常 . 














强制 类 型 转换 
混合 类 型 字符 串 操 作 需 要 把 普通 字符 串 转 换 成 Unicode 对 象 . 








异常 
UnicodeError 异常 是 在 exceptions 模块 中 定义 的 ，ValueError 的 子 类 . 所 有 关于 Unicode 
编 解 码 的 异常 都 要 继承 自 UnicodeError. 详 见 encode O 函数 . 
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E 
标准 编码 T 


X 6. 9 简洁 地 列 出 了 Python 中 常用 的 编码 方式 . 更 详细 、 完 全 的 列表 见 Python 的 文档 ， 下 
面 是 它 的 链接 : 
http://docs. python. org/lib/standard-encodings. html 





RE 引擎 对 Unicode 的 支持 





正则 表达 式 引擎 需要 Unicode 支持 . 详 见 6. 9 节 的 re 模块 . 





表 6.9 常用 Unicode 编辑 码 























编码 描述 
utf-8 变量 长 度 为 8 的 编码 (默认 编码 ) 
utf-16 变量 长 度 为 16 的 编码 (大 /小 端 ) 
utf-16-le 小 端 UTF-16 编码 

utf-16-be 大 端 UTF-16 编码 

ascii T-bit 7 位 ASCII 码 表 

iso-8859-1 ISO 8859-1 (Latin-1) 码 表 

unicode-escape (X Jl, Python Unicode 构造 函数 ) 
raw-unicode-escape (定义 见 Python Unicode 构造 函数 ) 
native Python 用 的 内 部 格式 
字符 串 格式 化 操作 符 





对 于 Python 的 格式 化 字符 串 的 操作 符 , %s 把 Python 字符 串 中 的 Unicode 对 象 执行 了 
str (u) 操作 , 所 以 ， 输 出 的 应 该 是 u. encode (默认 编码 ). 如 果 格 式 化 字符 串 是 Unicode 对 象 , 所 
有 的 参数 都 将 首先 强制 转换 成 Unicode 然后 根据 对 应 的 格式 串 一 起 进行 格式 转换 . 数字 首先 被 
转换 成 普通 字符 串 ， 然 后 在 转换 成 Unicode. Python 字符 串通 过 默认 编码 格式 转化 成 
Unicode. Unicode 对 象 不 变 ， 所 有 其 他 格式 字符 串 都 需要 像 上 面 这 样 转化 ， 下 面 是 例子 : 


























u Ys “s” % (u’abc’, abe’) u'abc abc^ 


6.9 ”相关 模块 
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表 6. 10 列 出 了 Python 标准 库 里 面 与 字符 串 有 关 的 主要 模块 . 


Table 6. 10 与 字符 串 类 型 有 关 的 模块 
























































模块 描述 
string 字符 串 操 作 相 关 函 数 和 工具 ， 比 如 Template 类 . 
re 正则 表达 式 : 强 大 的 字符 串 模 式 匹 配 模块 
struct 字符 串 和 二 进 制 之 间 的 转换 
c/StringlO 字符 串 缓冲 对 象 ， 操 作 方 法 类 似 于 file 2s. 
base64 Base 16, 32, 64 数据 编 解 码 
codecs 解码 器 注册 和 基 类 
crypt 进行 单方 面 加 密 
difflib' 找 出 序列 间 的 不 同 
hashlib' 多 种 不 同安 全 哈 希 算法 和 信息 摘要 算法 的 API 
hma‘ HMAC 信息 鉴 权 算法 的 Python 实现 
md5° RSA 的 MD5 信息 摘要 鉴 权 
rotor 提供 多 平台 的 加 解密 服务 
sha' NIAT 的 安全 哈 希 算法 SHA 











stringprep’ 提供 用 于 IP 协议 的 Unicode 字符 串 
textwrap° 文本 打包 和 填充 
unicodedata ”Unicode 数据 库 


a.  Python2. 1 新 加 

b. Python2. 5 新 加 

c.  Python2. 2 新 加 

d.  Python2. 5 的 hashlib 中 废除 
e.  Python2. 3 新 加 


核心 模块 : re 

正则 表达 式 (RE) 提供 了 高 级 的 字符 串 模 式 匹配 方案 . 通过 描述 这 些 模式 的 语法 , 你 可 以 像 使 
用 “过 滤器 ”一 样 高 效 地 查找 传 进来 的 文本 。 这 些 过 滤器 允许 你 基于 自 定 义 的 模式 字符 串 抽取 
匹配 模式 、 执 行 查找 -替换 或 分 割 字 符 串 . 


E e 
+ -*- e. 
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Pythonl. 5 中 加 入 的 re 模块 代替 了 早期 的 regex 和 regsub 模块 , 全 面 采 用 了 Perl 正则 表 
达 式 语法 , 使 得 Python 在 对 正则 表达 式 的 支持 方面 前 进 了 一 大 步 . Pythonl1. 6 里 面 重 写 了 正则 
表达 式 引 擎 (SRE) , 增加 了 对 Unicode 字符 串 的 支持 并 对 性 能 进行 了 重大 的 升级 . SRE 引擎 取代 了 
原 有 正则 表达 式 的 模块 下 的 PCRE 引擎 . 

该 模块 中 包含 的 关键 函数 有 :compile() - 将 一 个 RE 表达 式 编译 成 一 个 可 重用 的 RE 对 
象 ;match 0 - 试图 从 字符 串 的 开始 匹配 一 个 模式 ; 

search() - 找 出 字符 串 中 所 有 匹配 的 项 ;sub () - 进行 查找 替换 操作 。 其 中 的 一 些 函 数 返 
回 匹配 到 的 对 象 ， 你 可 以 通过 组 匹配 来 访问 〈 如 果 找 到 的 话 )。15 章 的 整 章 内 容 都 是 讲述 正则 
表达 式 。 


6.10 字符 串 关 键 点 总 结 


些 引 号 分 隔 的 字符 














你 可 以 把 字符 串 看 成 是 Python 的 一 种 数据 类 型 ,在 Python 单 引号 或 者 双 引 号 之 间 的 字符 数 
组 或 者 是 连续 的 字符 集合 . 在 Python 中 最 常用 两 个 引号 是 单 引号 CO MMS CO. FRR 
的 实际 内 容 是 这 些 单 引号 ( ) 或 者 双 引 号 () 之 间 的 字符 , 不 包括 引号 本 身 . 


























可 以 用 两 种 引号 来 创建 字符 串 是 很 有 益处 的 ， 因 为 是 当 你 的 字符 串 中 包含 单 引 号 时 , 如 果 
用 单 引号 创建 字符 串 , 那么 字符 串 中 的 双 引 号 就 不 需要 转 义 。 反 之 亦 然 . 














不 可 分 字符 类 型 
字符 串 是 唯一 的 字面 上 的 字符 序列 类 型 . 不 过 , 字符 本 身 并 不 是 一 种 类 型 , 所 以 , 字符 串 是 字 
符 存储 操作 的 最 基本 单位 . 字符 应 该 视 为 长 度 为 1 的 字符 串 . 




















字符 串 格 式 化 操作 符 (6 ) 提供 类 似 于 printf 0 那样 的 功能 . 
字符 串 格 式 化 操作 符 ( 见 6. 4. 1 节 ) 提 供 了 一 种 基于 多 种 输入 类 型 的 创建 自 定 义 字 符 串 的 灵 
活 方式 . 它 也 提供 了 类 似 于 C/C++ 世界 里 的 格式 化 操作 的 接口 . 









































三 引号 

在 6.7.2 节 里 面 我 们 介绍 了 三 引号 , 在 三 引号 字符 串 中 可 以 包含 诸如 换行 回 车 或 者 tab ait 
这 样 的 特殊 字符 . 三 引号 字符 串 是 用 两 边 各 三 个 单 引号 (，) 或 者 两 边 各 三 个 双 引 号 (%””) 来 定 
义 的 
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原始 字符 串 对 每 个 特殊 字符 串 都 使 用 它 的 原意 

第 6.4. 2 节 中 , 我 们 讲述 了 原始 字符 串 , 并 且 讨 论 了 它们 并 不 通过 反 斜 线 转 义 特殊 字符 的 特 
性 . 这 个 特性 使 得 原始 字符 串 非 常 适用 于 那些 需要 字符 串 原 意 的 场合 , 比如 在 定义 一 个 正则 表达 
式 时 . 





























Python 字符 串 不 是 通过 NUL 或 者 ' NO" 来 结束 的 

C 编 程 的 一 个 主要 问题 是 你 访问 了 一 个 字符 串 后 面 的 本 不 属于 你 的 空间 , 这 种 情况 发 生 在 你 
没有 在 字符 串 末尾 添加 终结 符 , NUL BE’ \0’ (ASCII 值 为 0) 的 时 候 . Python 不 仅 为 你 自动 管理 内 
存 , 而 且 也 把 C 的 这 个 负担 或 者 说 是 小 麻烦 去 掉 了 . Python 中 的 字符 串 不 是 以 NUL 结束 的 , 所 以 
你 不 需要 为 是 否 已 经 添加 终结 符 担心 . 字符 串 中 只 包含 你 所 定义 的 东西 , 没有 别 的 . 
























































6. 11 列表 


像 字 符 串 类 型 一 样 , 列表 类 型 也 是 序列 式 的 数据 类 型 , 可 以 通过 下 标 或 者 切片 操作 来 访问 
某 一 个 或 者 某 一 块 连续 的 元 素 . 然而 , 相同 的 方面 也 就 这 些 , 字符 串 只 能 由 字符 组 成 , 而 且 是 不 
可 变 的 (不 能 单独 改变 它 的 某 个 值 ), 而 列表 则 是 能 保留 任意 数目 的 Python 对 象 的 灵活 的 容器 。 
就 像 我 们 将 要 看 到 的 例子 中 所 示 , 创建 列表 非常 简单 , 向 列表 中 添加 元 素 也 是 如 此 . 
列表 不 仅 可 以 包含 Python 的 标准 类 型 , 而 且 可 以 用 用 户 定义 的 对 象 作为 自己 的 元 素 . 列表 
可 以 包含 不 同类 型 的 对 象 , 而 且 要 比 C 或 者 Python 自己 的 数组 类 型 (包含 在 array 扩展 包 中 ) 都 
要 灵活 . 因为 数组 类 型 所 有 的 元 素 只 能 是 一 种 类 型 . 列表 可 以 执行 pop, empt, sort, reverse 等 操 
VE. 列表 也 可 以 添加 或 者 减少 元 素 . 还 可 以 跟 其 他 的 列表 结合 或 者 把 一 个 列表 分 成 几 个 . 可 以 对 
单独 一 个 元 素 或 者 多 个 元 素 执行 insert, update, 或 者 remove 操作 . 


















































元 组 类 型 在 很 多 操作 上 都 跟 列 表 一 样 , 许多 用 在 列表 上 的 例子 在 元 组 上 照样 能 跑 , 我 们 有 一 
节 内 容 专门 讲解 元 组 类 型 . 它们 的 主要 不 同 在 于 元 组 是 不 可 变 的 , 或 者 说 是 只 读 的 , 所 以 那些 用 
于 更 新 列表 的 操作 , 比如 用 切片 操作 来 更 新 一 部 分 元 素 的 操作 , 就 不 能 用 于 元 组 类 型 . 














如 何 创建 列 表 类 型 数据 并 给 它 赋值 





创建 一 个 列表 就 像 给 一 个 变量 赋值 一 样 的 简单 . 你 手工 写 一 个 列表 ( 空 的 或 者 有 值 的 都 行 ) 
然后 赋 给 一 个 变量 , 列表 是 由 方 括号 (L]) 来 定义 的 , 当然 , 你 也 可 以 用 工厂 方法 来 创建 它 . 

















Edit By Vheavens 


—e| 


> - 





© 
e 


Edit By Vheavens 





2» alist = [123, abc’, 4.56, l'immr', 'list'], 7-9j] 
22» anotherList = [None, 'something to see here'] 
222 print alist 

[123, abc’, 4.56, l’ inner’, 'list'], (7-9j)] 

222^ print anotherList 

[None, 'something to see here'] 

2» aListfhatStartedEmpty = [] 

222 print alistThatStartedEmpty 

Lj 

2» List ( foo’) 

[fL o 


如 何 访问 列表 中 的 值 


列表 的 切片 操作 就 像 字 符 串 中 一 样 ;切片 操作 符 ([]) 和 索引 值 或 索引 值 范 围 一 起 使 用 


2» aListí0] 
123 
2» aListí[1:4] 
[’abc’, 4.56, [l inner’, 'list']] 
22» alist[:3] 
[123, ‘abc’, 4.56] 
2» alist [3] [1] 
list’ 


如 何 更 新 列表 


你 可 以 通过 在 等 号 的 左边 指定 一 个 索引 或 者 索引 范围 的 方式 来 更 新 一 个 或 几 个 元 素 , 你 也 
可 以 用 append 0 方法 来 追加 元 素 到 列表 中 去 . 





222^ alist 
[123, 'abc', 4.56, l’ inner’, 'list'], (7-9j)] 
2» aList[2] 


4. 56 

2» alist[2] = 'float replacer’ 

2225 alist 

/723 'abc', 'float replacer’, [’ inner’, 'list'], (7-95)] 
222 


22» anotherList.append( hi, i'm new here”) 





dim 
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>> print anotherList 

[None, 'something to see here’, “hi, i'm new here] 
22» aListfhatStartedEmpty. append (not empty anymore’) 
222^ print alistThatStartedEmpty 

[ not empty anymore’ J 


如 何 删除 列表 中 的 元 素 或 者 列表 (本 身 ) 




















要 删除 列表 中 的 元 素 , 如 果 你 确切 的 知道 要 删除 元 素 的 素 引 可 以 用 del 语句 , 否则 可 以 用 
remove () 方 法 . 








222 alist 

[123, 'abc', 'float replacer’, [’ inner’, 'list'], (7-95)] 
25» del alist[1] 
222 alist 

[123, 'float replacer’, [’inner’, 'list'], (7-9j)] 

25» alist. remove (123) 

222 alist 

[ float replacer’, [’inner’, 'list'], (7-9j)/ 


你 还 可 以 通过 pop 0 方法 来 删除 并 从 列表 中 返回 一 个 特定 对 象 . 
一 般 来 说 , 程序 员 不 需要 去 删除 一 个 列表 对 象 , 列表 对 象 出 了 作用 域 ( 比 如 程序 结束 , 函数 调 
用 完成 等 等 ) 后 它 会 自动 被 析 构 , 但 是 如 果 你 想 明 确 的 删除 一 整个 列表 , 你 可 以 用 del 语句 : 














del aList 


6.12 BRIER 
6.12.1 标准 类 型 操作 符 


在 第 4 章 里 , 我 们 介绍 了 一 些 适 用 于 包括 标准 类 型 在 内 的 大 部 分 对 象 的 操作 符 , 现在 我 们 来 
看 一 下 这 些 操作 符 如 何 作 用 在 列表 上 : 


>>> listi = [abe’, 123] 
> list2 = [ xyz’, 789] 





e+ 
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2» list3 = l'abc', 123] 

225 listl < list2 

True 

222 [ist2 < list3 

False 

22^ list2 > list8 and listl == list3 
True 








在 使 用 比较 操作 符 时 , 比较 数字 和 字符 串 是 很 明了 的 , 但 是 用 在 列表 上 时 就 不 是 那么 简单 了 ， 
列表 比较 操作 有 些 狐 独 , 但 是 合乎 逻辑 . 比较 列表 时 也 是 用 的 内 建 的 emp O 函数 , 基本 的 比较 逻辑 
是 这 样 的 :两 个 列表 的 元 素 分 别 比较 , 直到 有 一 方 的 元 素 胜 出 , 比如 我 们 上 面 的 例子 ，abc 和 
xyz 的 比较 直接 决定 了 比较 结果 , Œ abe € xyz’ 时 , listl<list2, list2>=list3, 元 组 类 型 在 
进行 比较 操作 时 跟 列 表 遵循 相同 的 逻辑 . 


6.12.2 序列 类 型 操作 符 
切片 ([] 和 [:]) 






































列表 的 切片 操作 跟 字 符 串 的 切片 操作 很 像 , 不 过 列表 的 切片 操作 返回 的 是 一 个 对 象 或 者 是 
几 个 对 象 的 集合 , 而 不 是 像 字符 串 那 样 , 返回 一 个 字符 或 者 一 个 子 串 . 我 们 定义 以 下 几 个 列表 用 
来 做 例子 : 


2» num list = [48, -1.23, -2 6. 19e5] 
2» str list = ['jack', 'jumped', 'over', 'candlestick'] 
2» mixup list = [40 [L 'x'], 'beef', -1. 9*6j] 


列表 的 切片 操作 也 遵从 正 负 索 引 规 则 , 也 有 开始 索引 值 , 结束 索引 值 , 如 果 这 两 个 值 为 空 , BR 
认 也 会 分 别 指 到 序列 的 开始 和 结束 位 置 . 

2» num listí1] 

=], 23 

225 

25^ num list[1:] 

[-1. 23, -2, 619000. 0] 

225 

2» num list[2:-1] 
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225 

BB» str list/[2] 
'over' 

2 str list[:2] 
[ jack’, 'jumped'] 
225 

eo” mixup list 
[40, [L 'x' ], beef, C1. 946j)] 
> mixup isti] 
I ux) 








跟 字 符 串 类 型 只 能 用 字符 为 元 素 不 同 , 列表 类 型 的 元 素 可 以 是 为 一 个 序列 类 型 , 这 就 意味 着 
你 在 列表 的 元 素 上 也 可 以 使 用 所 有 的 序列 操作 符 或 者 在 其 之 上 执行 序列 类 型 内 建 的 各 种 操作 . 
在 下 面 的 例子 中 , 我 们 将 会 展示 , 不 仅 可 以 在 一 个 切片 操作 的 结果 之 上 再 进行 切片 , 而 且 还 可 以 
改变 这 个 切片 的 结果 , 即使 新 对 象 的 类 型 跟 原 对 象 不 同 也 可 以 . 你 会 注意 到 , 这 跟 多 维 数组 有 一 E 











些 类 似 . 


2» mixup_list[{1][1] 
^y! 

2» mixup list[1][1] = -64. 875 

22^ mixup list 

[4.0, [L -64. 875], '"beef', (-L 9:65) ] 
XXIII num list ÍT — NBI: 

22^ num list 

/43, -1. 23, -2 6.1985] 

222 

2» num listí[2:4] = [16. 0, -49] 

p» 

222^ num list 

[43, -1. 23, 16.0, -49] 

222 

2 num list[0] 165535, 2e30, 76.45-10.27] 


dim 
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222 
222^ num list 
[[65535L, 2e*30, (76.45-1.3])], -1.23, 16.0, -49] 





注意 在 最 后 一 个 例子 中 , Bee AU fT TELE E EIS ER — 76 Be FRM PU. 在 列表 中 进行 诸如 
remove, add, 和 replace 的 操作 是 多 么 的 自由 了 吧 ! 还 有 一 点 要 注意 , 如 果 你 想 以 子 列表 的 形式 
得 到 一 个 列表 中 的 一 个 切片 , 那 需要 确保 在 赋值 时 等 号 的 左边 也 是 一 个 列表 而 不 是 一 个 列表 的 
TCR. 





























成 员 关 系 操 作 ( in ,not in) 
列表 中 (同样 适用 于 元 组 ) , 我 们 可 以 检查 一 个 对 象 是 否 是 一 个 列表 (或 者 元 组 ) 的 成 员 . 





22^ mixup list 
[4.0, [L 'x'], 'beef', (-1.9165)] 
222 
2» 'beef' in mixup list 
True 
222 
2S °x’ in mixup list 
False 
222 
>> "x! in mixup listí1] True 
222 num list 


[[65535L, 2e+030, (76. 45-1. 3j)], -1. 23, 16.0, -49] 
222 

222 -49 in num list 

True 

202 

225 34 in num list 

False 

2» 

> [65535L, 2e+030, (76.45-1.3])] in num list 
True 


注意 ，x 并 不 属于 mixup list, AW x AOA mixup list 的 一 个 成 员 , 而 是 
mixup_1list[1j] 的 , mixup_list[1j 也 是 一 个 列表 类 型 . 成员 关 系 操作 运算 同样 适用 于 元 组 类 型 . 
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连接 操作 符 允 许 我 们 把 多 个 列表 对 象 合并 在 一 起 . 注意 , 列表 类 型 的 连接 操作 也 只 能 在 同类 
型 之 间 进 行 , 换 句 话说 , 你 不 能 把 两 个 不 同类 型 的 对 象 连接 在 一 起 , 即便 他 们 都 是 序列 类 型 也 不 
行 





连接 接 操 作 符 ( + ) 














2» num list = [43, -1.23, -2 6. 19e5] 

2M» str list = ['jack', 'jumped', 'over', 'candlestick' ] 

2» mixup list = [4.0, [Ll 'x'], 'beef', -1. 9*6j] 

222 

22^ num list + mixup list 

[48, -1. 23, -2 619000. 0, 40, [L 'x ], ‘beef’, (-1.9*65)] 

222 

225 str list + num list 

[ jack’, 'jumped', 'over', ‘candlestick’, 43, -1.23, -2 619000. 0J 














符 把 一 个 列表 的 内 容 添加 到 另 一 个 中 去 . 使 用 extend () 方 法 比 连接 操作 的 一 个 优点 是 它 实 际 上 
是 把 新 列表 添加 到 了 原 有 的 列表 里 面 , 而 不 是 像 连接 操作 那样 新 建 一 个 列表 。1ist. extend () 
方法 也 被 用 来 做 复合 赋值 运算 , 也 就 是 Python2. 0 中 添加 的 蔡 换 连 接 操作 (+=). 











在 6. 23 节 里 面 我 们 会 讲 到 , 从 Python. 5. 2 起 , 我 们 可 以 用 extend O AARRE EIERE 





必须 指出 , 连接 操作 符 并 不 能 实现 向 列表 中 添加 新 元 素 的 操作 . 在 接 下 来 的 例子 中 , 我 们 展 
示 了 一 个 试图 用 连接 操作 向 列表 中 添加 新 元 素 报 错 的 例子 . 








>> num list + 'new item’ Traceback (innermost last): 
File &stdin^/^, line l, in ? 


TypeError: illegal argument type for built-in operation 


这 个 例子 之 所 以 是 错误 的 , 是 因为 我 们 在 连接 操作 符 的 左右 两 边 使 用 了 不 同类 型 的 值 , 列表 
类 型 + 字符 串 类 型 这 样 的 操作 是 非法 的 . 显然 , 我 们 的 初衷 是 把 一 个 字符 串 作为 一 个 新 元 素 添 
加 到 列表 中 去 , 不 过 我 们 的 方法 不 正确 . 幸运 的 是 , 我 们 有 一 个 正确 的 方法 : 









































使 用 内 建 函 数 append() (我 们 会 在 6.13 节 里 面 正 是 地 介绍 append 0 和 其 他 内 建 函 数 ) 
[e— 一 一 —e € 
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25» num list.append( new item’) 


重复 操作 符 ( * ) 





重复 操作 符 可 能 更 多 的 应 用 在 字符 串 类 型 中 , 不 过 , 列表 和 元 组 跟 字 符 串 同属 序列 类 型 , 所 
以 需要 的 时 候 也 可 以 使 用 这 一 操作 . 











D>» num list * 2 

[43, -1. 23, -2 619000 0, 43, -1.23, -2 619000. 0] 
2> 

22^ num list * 8 

[43, -1. 23, -2 619000.0, 43, -1.23, -2 619000.0, 43, 
-1.23, -2 619000. 0J 

Python2. 0 起 , 也 开始 文 持 复合 赋值 运算 : 


2 hr 三 一 
>> hr *- 30 
D> hr 


6.12.3 列表 类 型 操作 符 和 列表 解析 


其 实 Python 中 没有 专门 用 于 列表 类 型 的 操作 符 . 列表 可 以 使 用 大 部 分 的 对 象 和 序列 类 型 的 
操作 符 . 此 外 , 列表 类 型 有 属于 自己 的 方法 . 列表 才 有 的 构建 一 列表 解析 . 这 种 方法 是 结合 了 列表 
的 方 括 弧 和 for 循环 , 在 逻辑 上 描述 要 创建 的 列表 的 内 容 . 我 们 在 第 八 章 讨论 列表 解析 , 这 里 仅 
仅 回 本 章 其 他 地 方 所 做 的 那样 , 展示 一 个 简单 的 例子 : 





















































DS [ i x2 for i in /8 -2 Sf J 


[16, -4, 10] 
2 [ i for i inrange(8) ifif2--0] 
[0 2 4 6/ 


6.13. 内 建 函 数 


dim 
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6.13.1 标准 类 型 函数 


cmp () 








在 4.6.1 章 节 里 ,我 们 通过 比较 数字 和 字符 串 介 绍 了 内 建 cmp O 函数 . 但 我 们 还 不 知道 cmp () 
函数 是 如 何 跟 其 他 的 比如 列表 和 元 组 类 型 合作 的 , 这 些 类 型 不 仅 含 有 数字 和 字符 串 , 而 且 还 有 列 
X, 元 组 , 字典 之 类 的 其 他 对 象 , 甚至 可 以 是 用 户 自 定义 的 对 象 . 这 种 情况 下 cmp O 函数 是 如 何 工 
作 的 呢 ? 




















> listl, list2 = [123, 'xyz'], [456, 'abc'] 
2» emp(listl, list2) 

-1 

222 

2» emp(listZ, listl) 

1 

D> list3 = list? + [789] 


222 [ist3 

[456, abc’, 789] 
222 

2» emp(listZ, list3) 


-7 





如 果 我 们 比较 的 是 两 个 同类 的 对 象 , 比较 操作 是 非常 直观 的 . 比如 数字 和 字符 串 , 直接 比较 
它们 的 值 就 行 了 。 对 于 序列 类 型 ， 比 较 操作 稍微 有 点 复杂 了 ,但 是 方式 上 有 相似 Python 在 两 个 
对 象 基 本 不 能 比较 的 时 候 尽 量 做 出 公平 的 结果 , 比如 当 两 个 对 象 没 有 关系 时 或 者 两 种 类 型 根本 
就 没有 用 于 比较 的 函数 时 , 这 时 Python 只 能 根据 ”逻辑 ”来 做 出 结论 . 




















除了 这 种 极端 的 情况 之 外 , 安全 又 健全 的 比较 方法 是 如 果 有 不 相等 的 情况 出 现 , 比较 操作 就 
结束 . 这 种 算法 是 如 何 工作 的 呢 ? 像 我 们 前 面 简短 的 提 到 过 的 , 列表 的 元 素 是 可 以 无 限 迭 代 的 . 如 
果 它 的 元 素 都 是 相同 类 型 , 则 用 标准 的 比较 方法 来 作 比较 . 否则 , 如 果 要 比较 的 元 素 类 型 不 一 致 ， 
就 像 我 们 前 面 提 到 过 的 那样 , 如 果 比 较 的 对 象 不 一 致 , 那么 要 得 到 一 个 准确 的 或 者 说 绝对 的 比较 
结果 就 有 些 冒险 . 



































当 我 们 较 listl 和 list2 时 , 1istl 和 list2 进行 逐 项 比较 . 第 一 个 比较 操作 发 生 在 两 个 列 
表 的 第 一 个 元 素 之 间 , 比如 说 , 123 ER 456 比较 , 因为 123«456, 所 以 listi 被 认为 小 于 list2. 
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如 果 比 较 的 值 相 等 , 那么 两 个 序列 的 下 一 个 值 继续 比较 , 直到 不 相等 的 情况 出 现 , 或 者 到 达 
较 短 的 一 个 序列 的 末尾 , 在 这 种 情况 下 , 长 的 序列 被 认为 是 ^ 较 大 “的 . 这 就 是 为 什么 上 面 的 
list2<list3 的 原因 .元 组 类 型 比较 也 是 用 这 种 算法 . 最 后 我 们 以 这 种 算法 的 关键 点 作为 本 节 的 
结束 : 
































1. ”对 两 个 列表 的 元 素 进 行 比较 . 
2. ”如 果 比 较 的 元 素 是 同类 型 的 , 则 比较 其 值 , 返回 结果 . 
3. ”如 果 两 个 元 素 不 是 同一 种 类 型 , 则 检查 它们 是 否 是 数字 . 
a. 如 果 是 数字 , 执行 必要 的 数字 强制 类 型 转换 , 然后 比较 . 
b. 如 果 有 一 方 的 元 素 是 数字 , 则 另 一 方 的 元 素 “大” (数字 是 ”最 小 的 ”) 
c. 否则 ,通过 类 型 名 字 的 字母 顺序 进行 比较 . 
4. ”如 果 有 一 个 列表 首先 到 达 末 尾 , 则 另 一 个 长 一 点 的 列表 “大 “. 
5. ”如 果 我 们 用 尽 了 两 个 列表 的 元 素 而 且 所 有 元 素 都 是 相等 的 , 那么 结果 就 是 个 平局 , 就 
是 说 返回 一 个 0. 


$ 6.13.2 序列 类 型 函数 E: 


len () 



































对 字符 串 来 说 Len () 返回 字符 串 的 长 度 , 就 是 字符 串 包 含 的 字符 个 数 . 对 列表 或 者 元 组 来 说 ， 
它 会 像 你 想像 的 那样 返回 列表 或 者 元 组 的 元 素 个 数 , 容器 里 面 的 每 个 对 象 被 作为 一 个 项 来 处 理 ， 
我 们 下 面 的 例子 用 了 上 面 已 经 定义 的 列表 











2^» len(num list) 

4 

225 

2^» len(num list*2) 
8 


max() and min () 





max () 和 min O 函数 在 字符 串 操作 里 面 用 处 不 大 , 因为 它们 能 对 字符 串 做 的 只 能 是 找 出 字符 


dim 
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串 中 “最 大 “和 ”最 小 “的 字符 ( 按 词 典 序 ), 而 对 列表 和 元 组 来 说 , 它们 被 定义 了 更 多 的 用 处 . 比如 
对 只 包含 数字 和 字符 串 对 象 的 列表 , max 0) 和 min (函数 就 非常 有 用 , 重申 一 遍 , 混合 对 象 的 结构 
越 复杂 返回 的 结构 准确 性 就 越 差 . 然而 , 在 有 些 情况 下 (虽然 很 少 ), 这 样 的 操作 可 以 返回 你 需要 
的 结果 . 我 们 展示 了 一 些 使 用 上 面 定义 好 的 列表 的 例子 . 









































2» max(str list) 

’ park’ 

252^ max (num list) 

[65535L, 2e730, (76. 45-1. 3j)] 
2» min(str list) 
'candlestick' 

25^ min(num list) 

-49 


sorted () and reversed 


2 s = [’ They’, 'stamp, 'them', 'when', ^they're^, ‘small’ / 
2 for t in reversed (s): 
print t, 


small they're when them stamp They 
22^ sorted (s) 
[ They’, small’, 'stamp', ° them, ^they' re^, 'when'] 














初学 者 使 用 字符 串 , 应 该 注意 是 如 何 把 单 引 号 和 双 引 号 的 使 用 矛盾 和 谐 掉 . 同时 还 要 注意 字 
符 串 排序 使 用 的 是 字典 序 , 而 不 是 字母 序 CERE T 的 ASCII 码 值 要 比 字 母 a^ 的 还 要 靠 前 ) 














enumerate() and zip() 


22^ albums = ['tales', 'robot', 'pyramid J 
2^ for i, album in enumerate (albums) : 


print i, album 
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0 tales 
1 robot 
2 pyramid 
D»»> 
S»»> fn = [l ian’, ‘stuart’, 'david'] 
2» In = [’bairnson’, ’elliott’, 'paton'/ 
»»»> 
2 for i, insip(fm lm: 
print (%s %s’ % (i, D). titleQ 


lan Bairnson Stuart Elliott David Paton 
sum() 
M9 a - [6 4, 5] 

2^» reduce (operator. add, a) 

15 

22^ sum (a) 

15 


2^ sum(a, 5) 


20 

D a= 16.5 EM 
22^ sum (a) 

15. 0 


list() and tuple() 


list O KÆ tuple O 函数 接受 可 迭代 对 象 (比如 另 一 个 序列 ) 作为 参数 , 并 通过 浅 拷贝 数据 
来 创建 一 个 新 的 列表 或 者 元 组 . 虽然 字符 串 也 是 序列 类 型 的 , 但 是 它们 并 不 是 经 常用 于 list ORI 
tupleO. 更 多 的 情况 下 , 它们 用 于 在 两 种 类 型 之 间 进 行 转换 , 比如 你 需要 把 一 个 已 有 的 元 组 转 
成 列表 类 型 的 (然后 你 就 可 以 修改 它 的 元 素 了 ) , 或 者 相反 
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2» alist = [’tao’, 93, 99, 'time'] 

2» afuple = tuple(aList) 

225^ alist, aTuple 

([’ tao’, 93, 99, 'time' ], ( tao’, 93, 99, 'time')) 
22» alist == afuple 

False 

22» anotherList = list(aTuple) 

22» alist == anotherList 

True 

22» alist is anotherList 

False 

22^ [id(x) for x in alist, aTuple, anotherList/ 
[10903800, 11794448, 11721544] 


正如 我 们 在 本 章 的 开头 所 讨论 的 ,无 论 list0 〇 还 是 tuple O 都 不 可 能 做 完全 的 转换 ( 见 
6.1.2 45). 也 就 是 说 , 你 传 给 tuple O 的 一 个 列表 对 象 不 可 能 变 成 一 个 元 组 , 而 你 传 给 list O 的 





对 象 也 不 可 能 真正 的 变 成 一 个 列表 . 虽然 前 后 两 个 对 象 (原来 的 和 新 的 对 象 ) 有 着 相同 的 数据 集 
合 ( 所 以 相等 = ), 但 是 变量 指向 的 却 不 是 同一 个 对 象 了 (所 以 执行 is 操作 会 返回 false). 还 
要 注意 , 即使 它们 的 所 有 的 值 都 相同 , 一 个 列表 也 不 可 能 “等 于 “一 个 元 组 . 


6.13.3 ”列表 类 型 内 建 函 数 


如 果 你 不 考虑 range 0 函数 的 话 , Python 中 没有 特定 用 于 列表 的 内 建 函 数 . range O 函数 接 
受 一 个 数值 作为 输入 , 输出 一 个 符合 标准 的 列表 . 第 8 章 里 面 详细 讨论 了 range O 函数 . 列表 类 型 
对 象 可 以 使 用 大 多 数 的 对 象 和 序列 的 内 建 函数 , JP EL, 列表 对 象 有 属于 它们 自己 的 方法 . 


6.14 列表 类 型 的 内 建 函 数 


Python 中 的 列表 类 型 有 自己 的 方法 . 我 们 会 在 第 13 章 面 向 对 象 编程 里 面 正式 而 详细 的 介绍 
方法 这 一 概念 , 现在 你 只 需要 把 方法 视 为 特定 对 象 的 函数 或 者 过 程 就 好 . 本 节 讨 论 的 方法 就 像 内 
建 的 函数 一 样 , 除了 它们 只 对 列表 类 型 进行 操作 之 外 . 因为 这 些 函 数 涉及 到 对 列表 更 改 ( 或 者 说 
更 新 ), 所 以 它们 都 不 适应 于 元 组 . 
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方法 也 是 这 样 :1ist. method O .我 们 用 点 号 来 访问 一 个 对 象 的 属性 (在 这 里 是 一 


函数 操作 符 ( O ) 来 调 
我 们 可 以 在 一 个 列 





用 这 个 方法 . 
表 对 象 上 应 用 dir () 方 法 来 得 到 它 所 有 的 方法 和 属性 : 








2» dir(list) # or dir(/]) 


[’__add_’, 


class _’, 


contains ^", ' delattr /, 





J delitem , 


了 P4 I 


Se , 
^ getslica8 ^, 





getattribute  ', 


zs P4 # 


| delslice ', ' doc ,, eq ^|, 





= getitem ,, 
hash °, ' iadd /', 


2 # 3 


gt, 





imul ’, 


init ’, 


iter ，,, le ’°, ` len ， 





mul, 


P4 2j 3 3 了 


P4 
ne, new, reduce, 





| reduce ex ^, 


E E 3 
repr, reversed, rmul , 





__setattr_’, 
append’, 


'remove', 


"count, 


'reverse', 





J| setitem ^', ' setslice ^, str’, 


“pop; 





'extend', 'index', ’ insert’, 


"sort / 





# 6.11 FHS A 
# 6.11 列表 


List Method 
list. append (obj) 
list. 
list. 
list. index (obj, 
j=len(list)) 


count (obj) 


list. 
list 
list. 
list 
list 


remove (obj) 
. reverse () 








extend (seq) * 


insert (index, 
. pop (index=-1) ° 





前 列表 类 型 支持 的 所 有 方法 , 稍 后 我 们 给 
类 型 内 建 函 数 





Operation 
向 列表 中 添加 一 个 对 象 obj 
一 个 对 象 obj 在 列表 中 出 现 的 次 数 
把 序列 seq 的 内 容 添 加 到 列表 中 
i70, 


-e| 


以 重 温 以 下 我 们 前 面 讲 到 的 用 点 号 的 方式 访问 对 象 的 属性 :object. attribute. 列表 的 


个 函数 ), 然后 用 


从 出 使 用 这 些 方法 的 例子 . 


返回 list[k] == obj 的 k 值 ,并 且 k 的 范围 在 i<=k<j; Bl 


引发 ValueError 异常 . 
在 索引 量 为 index 的 位 置 插入 对 象 obj. 





obj) 








从 列表 中 删除 对 象 obj 
原 地 翻转 列表 


. sort (func=None, key=None， 


—o— 
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删除 并 返回 指定 位 置 的 对 象 , 默认 是 最 后 一 个 对 象 
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reverse-False)' 以 指定 的 方式 排序 列表 中 的 成 员 , 如 果 func 和 key 参数 指定 ， 
则 按照 指定 的 方式 比较 各 个 元 素 , 如 果 reverse 标志 被 置 为 
True, 则 列表 以 反 序 排列 . 

a.  Pythonl. 5. 2 加 入 的 特性 . 

b. key 和 reverse 特性 在 Python2. 4 中 新 添 . 








25» music media = [45] 
222 music media 
[45] 
225 
22^ music media. insert(0, 'compact disc’) 
222 music media 
[ compact disc’, 45] 
225 
>>> music media. append( long playing record’) 
222 music media 
[ compact disc’, 45, 'long playing record ] 
PP» 
22^ music media. insert (2, '8-track tape’) 
222 music media 


[ compact disc’, 45, '8-track tape’, 'long playing record / 





在 前 面 的 例子 中 , 我 们 用 一 个 元 素 初 始 化 了 一 个 列表 , A PARI FERUNTUR. BCE AI 
加 新 的 元 素 后 ， 都 会 去 检查 这 个 列表 . 现在 确认 一 下 一 个 值 是 否 在 我 们 的 列表 中 , 并 看 看 如 何 找 
出 元 素 在 列表 中 的 索引 值 . 我 们 用 in 操作 符 和 index () 方 法 实现 这 两 个 需求 . 

25» 'cassette' in music media 

False 

25^ 'compact disc’ in music media 





























True 

25^ music media. index (45) 

1 

2» music media. index( 8-track tape’) 
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>>> music media. index ( cassette’) Traceback (innermost last): 
File “<interactive input’, line 0, in ? ValueError: list. index (x): x not in list 


WR Ra — PIT EA UE I TUE, ARH index () 来 检查 一 个 元 素 是 否 存在 于 一 个 list 
中 并 不 是 个 好 主意 , 因为 我 们 出 错 了 . 应 该 先 用 in 成 员 关 系 操作 符 (或 者 是 not in) 检 查 一 下 , 然 
后 在 用 index O 找到 这 个 元 素 的 位 置 。 我 们 可 以 把 最 后 几 个 对 index O 调用 放 到 一 个 单独 的 for 
循环 里 面 , 像 这 样 : 


for eachMediaType in (45, '8-track tape’, 'cassette'): 
if eachMediaType in music media: 
print music media. index (eachMediaType) 




















这 个 方案 避免 了 我 们 上 面 犯 的 错误 , 因为 在 确认 一 个 元 素 属于 该 列表 之 前 index (方法 是 不 
会 被 调用 的 . 稍 后 我 们 将 会 发 现 该 如 何 处 理 这 种 错误 , 而 不 是 这 样 的 一 出 错 ， 程 序 就 月 溃 了 。 
接 下 来 我 们 测试 sort O 和 reverse (方法, 它们 会 把 列表 中 的 元 素 排序 , 然后 翻转 . 





























222 music media 
[' compact disc’, 45, '8-track tape’, 'long playing record J 
2^» music media. sort () 
222 music media 
[45, '8-track tape’, 'compact disc’, 'long playing record / 
2> music media. reverse () 
222 music media 
[ long playing record’, 'compact disc’, '8-track tape’, 45] 


核心 笔记 :那些 可 以 改变 对 象 值 的 可 变 对 象 的 方法 是 没有 返回 值 的 ! 
Python 初学 者 经 常会 陷入 一 个 误区 :调用 一 个 方法 就 返回 一 个 值 . 最 明显 的 例子 就 是 


sort () : 
2» music media.sort()*" ZA ful? 
222 


在 使 用 可 变 对 象 的 方法 如 sort O , extend O 和 reverse O 的 时 候 要 注意 , 这 些 操作 会 在 列表 
中 原 地 执行 操作 , 也 就 是 说 现 有 的 列表 内 容 会 被 改变 , 但 是 没有 返回 值 ! 是 的 , 与 之 相反 , 字符 串 
方法 确实 有 返回 值 : 
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2» ’leanna, silly girl!'.upper() 

"LEANNA, SILLY GIRL!’ 

温习 一 下 , 字符 串 是 不 可 变 的 一 不 可 变 对 象 的 方法 是 不 能 改变 它们 的 值 的 , 所 以 它们 必须 
返回 一 个 新 的 对 象 . 如 果 你 确实 需要 返回 一 个 对 象 , 那么 我 们 建议 你 看 一 下 Python2. 4 以 后 加 入 
的 feversed() 和 sorted() 内 建 函 数 . 

它们 像 列 表 的 方法 一 样 工作 , 不 同 的 是 它们 可 以 用 做 表达 式 , 因为 它们 返回 一 个 对 象 . 同时 
原来 的 那个 列表 还 是 那个 列表 , 没有 改变 , 而 你 得 到 的 是 一 个 新 的 对 象 . 




















回 到 sort O Wik, 它 默 认 的 排序 算法 是 归并 排序 (或 者 说 “timsort”) 的 衍生 算法 , 时 间 复 杂 
度 是 0(lg(n!)). 关于 这 个 算法 我 们 不 做 进一步 的 讲解 , 可 以 通过 源码 查看 它们 的 详情 一 
Ob jects/listobject. c, 还 有 算法 描述 : Objects/listsort. txt. 




















extend () 方 法 接受 一 个 列表 的 内 容 然 后 把 它 的 所 有 元 素 追 加 到 另 一 个 列表 中 去 : 





222 new media = ('24/96 digital audio disc’, 'DVD Audio disc’, 'Super Audio CD’ / 
25^ music media. extend (new media) 
222 music media 
[ long playing record’, 'compact disc’, '8-track tape’, 
45, '24/96 digital audio disc’, 'DVD Audio disc’, 'Super 
Audio CD'] 





从 2.2 开始 , extend O Z TATUS BSC RHE IGOR, TE 2. 2 ZH, 它 的 参数 必须 是 序列 对 
象 , 而 在 1.6 之 前 它 的 参数 必须 是 列表 对 象 .通过 可 迭代 对 象 ( 而 不 是 一 个 序列 对 象 ), 你 能 做 更 
多 有 趣 的 事情 , 比如 : 











2» motd = [] 

>>> motd. append C MSG OF THE DAY’) 

2» f = open( /etc/motd', 'r') 

>>> motd. extend (£) 

2» f. close 0 

222 motd 

/ MSG OF THE DAY’, ° Welcome to Darwin! \n’ / 
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1.5. 2 中 加 入 的 pop () 方 法 会 从 列表 中 把 最 后 的 或 指定 的 元 素 返 回调 用 者 . 我 们 会 在 6. 15. 1 
节 和 练习 中 看 到 pop () 方法 ， 


6.15 列表 的 特殊 特性 
6.15.1 用 列表 构建 其 他 数据 结构 


列表 有 容器 和 可 变 的 特性 , 这 使 得 它 非常 灵活 , 用 它 来 构建 其 他 的 数据 结构 不 是 件 难 事 . 我 
们 马上 能 想到 的 是 堆栈 和 队列 . 





























堆栈 

堆栈 是 一 个 后 进 先 出 (LIF0) 的 数据 结构 , 其 工作 方式 就 像 自 助 餐厅 里 面 用 于 放 盘 子 的 弹 筑 
支架 . 把 盘子 想像 成 对 象 , 第 一 个 离开 堆栈 的 是 你 最 后 放 上 的 那个 . ERE push” 元 素 是 个 常用 
术语 , 意思 是 把 一 个 对 象 添加 到 堆栈 中 . 反之 , 要 删除 一 个 元 素 ， 你 可 以 把 它 %pop” 出 堆栈 , 例 6. 3 
展示 了 一 个 菜单 驱动 的 程序 , 它 实现 了 一 个 简单 的 、 用 于 存储 字符 串 的 堆栈 . 











逐 行 解释 


1-3 行 
一 开始 是 Unix 的 起 始 行 , 然后 我 们 初始 化 堆栈 (其 实 是 个 列表 ). 
例 6.3 用 列表 模拟 堆栈 (stack. py) 





这 个 简单 的 脚本 把 列表 做 为 堆栈 用 于 存储 和 取 回 输入 的 字符 串 , 这 个 菜单 驱动 驱动 的 程序 
仅 使 用 了 列表 的 append 和 pop0 〇 方法 . 





1 #!/usr/bin/env python 

2 

3 stack = [7 

4 

5 def pushit(): 

6 stack. append (raw input( Enter new string: `°). strip 0) 
7 

8 def popit: 

9 if len(stack) == 0: 
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> -$ 





dim 
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10 print 'Cannot pop from an empty stack!’ 
77 else: 
12 print 'Removed [',  'stack.popO 5 °P 
13 
14 def viewstack(): 
15 print stack # calls str() internally 
16 
17 MDs = lu’: pushit, 'o': popit, °v’: viewstack] 
18 
19 def showmenu(): 
20 pr = ""* 
21 p(W) sh 
22 p(0)p 
23 (V)iew 
24 (Quit 
25 
26 Enter choice: 
27 
28 while True: 
29 while True: 
30 try: 
31 choice = raw input (pr). strip O [0]. lower O 
32 except (E0FError, KeyboardInterrupt, IndexError) : 


ff ff ff 


2 


33 choice = 'q 
34 

35 print '|nYou picked: [%s/’ % choice 
36 if choice not in 'uovq': 

37 print 'Invalid option, try again’ 
38 else: 

39 break 

40 

41 if choice == 'q': 

42 break 
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43 OllDs[choice] O 

44 

45 if name ==’ main 
46 showmenu () 





5-6 fT 
pushit O 函数 添加 一 个 元 素 (通过 提示 由 用 户 输入 ) 到 堆栈 中 . 





8-12 fT 
popit 0 函数 从 堆栈 中 移 除 一 个 元 素 (最 新 的 那个 ). 试图 从 一 个 空 的 堆栈 中 移 除 元 素 会 引 
发 一 个 错误 . 这 种 情况 下 , 用 户 会 得 到 一 个 警告 提示 . 当 一 个 元 素 从 堆栈 中 pop 出 来 时 , 用 户 可 以 
看 到 到 底 是 哪个 元 素 被 移 除 了 . 我 们 用 反 单 引号 ( ) 来 代替 repr () 函数 , ,把 字符 串 的 内 容 用 引号 
括 起 来 显示 而 不 是 单单 显示 字符 串 的 内 容 . 

















14-15 行 
viewstack () 方 法 显示 堆栈 现 有 的 内 容 . 





Line 17 

虽然 我 们 下 一 章 才 会 正式 讲解 字典 类 型 ,但 是 这 里 我 们 还 是 希望 给 你 展示 一 个 小 例子 ,一 
个 包含 命令 的 矢量 (CMDs). 这 个 字典 的 内 容 是 前 面 定 义 的 三 个 “动作 ”函数 , 它们 可 以 通过 字母 进 
行 访问 , 用 户 必 须 输 入 这 些 字母 来 执行 相应 的 命令 . 比如 说 , 要 进 栈 一 个 字符 串 , 用 户 就 必须 输入 
^u ,那么 字母 'u 是 如 何 从 字典 里 面 访问 到 pushit O 函数 的 呢 ? 在 第 43 行 执行 了 选择 的 函数 . 

















19-43 行 

整个 菜单 驱动 的 应 用 都 是 由 showmenu () 函数 控制 的 . 它 首 先 同 用 户 提 供 一 个 选单 , 如 果 用 户 
输入 了 合法 选项 就 调用 相应 的 函数 . 我 们 还 没有 详细 的 涉及 到 异常 的 处 理 ，try-except 语句 , 但 
本 节 里 面 的 代码 允许 用 户 输入 “D(EOF, 产生 一 个 EOF 错误 ) 或 者 “C( 中 断 退 出 ,产生 一 个 
KeyboardInterrupt 异常 ), 这 两 种 操作 在 我 们 的 脚本 里 面 都 会 得 到 处 理 , 结果 等 同 于 用 户 输入 
' q 退出 应 用 程序 . 这 是 对 Python 异常 处 理 特性 的 一 次 应 用 , 说 明了 Python 的 异常 处 理 机 制 是 多 
么 方便 . 外 循环 用 来 执行 用 户 输入 的 指令 直到 用 户 退 出 应 用 , 内 循环 提示 用 户 输入 一 个 合法 的 命 


令 项 . 









































45-46 47 
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dim 
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如 果 调 用 文件 ， 这 部 分 的 代码 就 会 启动 程序 . 如 果 该 脚本 只 是 被 作为 一 个 模块 导入 , 则 仅仅 
是 导入 定义 的 函数 和 变量 , TL SET LAS IR. 关于 第 45 M — name 变量 , 请 查阅 第 
3.4.17. 

下 面 简单 的 执行 了 一 下 该 脚本 : 


$ stack. py p(U)sh 
p(0)p 

(V) iew 

(Quit 


Enter choice: u 


You picked: [u] 
Enter new string: Python 


p) sh p(0)p 
(V) iew 
(Quit 


Enter choice: u 


You picked: [u] 
Enter new string: is 


p (sh p(0)p 
(V) iew 
(Quit 


Enter choice: u 


You picked: [u/ 
Enter new string: cool! 





二 一 —o— — 
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p) sh p(0)p 
(V) iew 
(Quit 


Enter choice: v 


You picked: [v] 
[ Python’, 'is', 'cool!'] 


pi) sh p(0)p 
(V) iew 
(Quit 


Enter choice: o 


You picked: [o] Removed [ 'cool!' J 
psh p(0)p 

(V) iew 

(Quit 


Enter choice: o 


You picked: [o] Removed [ 'is' J 
psh p(0)p 

(V) iew 

(Quit 


Enter choice: o 


You picked: [o] Removed [ ° Python’ J 
psh p(0)p 

(V) iew 

(Quit 


e+ 
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Enter choice: o 


You picked: [o] 
Cannot pop from an empty stack! 


p (sh p(0)p 
(V) iew 
(Quit 


Enter choice: D You picked: [q] 


队列 
队列 是 一 种 先进 先 出 (FIF0) 的 数据 类 型 , 它 的 工作 原理 类 似 于 超市 中 排队 交 钱 或 者 银行 里 
面 的 排队 , 队列 里 的 第 一 个 人 首先 接受 服务 ( 
满心 想 第 一 个 出 去 ). 新 的 元 素 通 过 入 队 “ 的 方式 添加 进 队 列 的 末尾 ,“ 出 队 “ 就 是 从 队列 的 








头 部 删除 . 下 面 的 例子 里 面 展 示 了 这 种 操作 , 我 们 把 上 面 的 堆栈 的 例子 进行 了 改造 ,用 列表 实现 
了 一 个 简单 的 队列 . 
例 6.4 把 列表 用 做 队列 (queue. py) 
这 个 例子 中 , 我 们 把 列表 用 做 队列 来 存储 和 取 回 菜单 驱动 应 用 里 面 输 入 的 字符 串 , 只 用 到 了 
列表 的 append O 和 pop 0 〇 方法 . 





1 #l/usr/bin/env python 


2 

3 queue = [] 

4 

5 def enQQ): 

6 queue. append (raw input( Enter new string: ').strip 0) 
7 

8 def deQO: 


9 if len(queue) == 0: 
10 print 'Cannot pop from an empty queue!’ 
77 else: 
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12 print 'Removed [’,  *'queue.pop(0) *, °F 
13 
14 def viewQ: 
15 print queue # calls str() internally 
16 
17 MDs = Ce’: enQ, 'd': deQ °v’: view} 
18 
19 def showmenu(): 
20 pr = ""* 
21 (E)nqueue 
22 (D)equeue 
23 (V)iew 
24 (Quit 
25 
26 Enter choice: 
27 
28 while True: 
29 while True: 
30 try: 
31 choice = raw input (pr). strip O [0]. lower O 
32 except (EOFError, KeyboardInterrupt, IndexError): 


Ld d 


33 choice = 'q' 

34 

35 print '|nYou picked: [%s/’ % choice 
36 if choice not in 'devq': 

37 print 'Invalid option, try again’ 
38 else: 

39 break 

40 

41 if choice == 'q': 

42 break 

43 MDs [choice] Q 

44 
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45 if name  -- ' main 
46 showmenu () 





逐 行 解释 
该 脚本 跟 上 面 的 stack. py 非常 相似 , 所 以 我 们 只 讲解 一 下 有 显 








n 
za 
可 
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a 








l-T 4T 
定义 了 几 个 后 面 脚本 要 用 到 的 常量 . 





Lines 5-6 
enQO AKER pushit 0 方法 非常 相近 , 只 不 过 名 字 改 变 了 . 


8-12 fT 


两 个 脚本 的 主要 差别 就 在 于 此 , deQ O 函数 不 像 popit O 函数 那样 把 列表 的 最 后 一 个 元 素 
弹出 来 , 而 是 第 一 个 元 素 . 


17, 21-24, 36 行 
选项 改变 了 , 所 以 我 们 也 需要 重 写 原 来 的 提示 信息 和 输入 检查 . 


还 是 在 这 里 列举 一 些 输 出 : 











$ queue. py 
(E) nqueue 
(D) equeue 
(V) iew 
(Quit 


Enter choice: e 


You picked: [e/ 
Enter new queue element: Bring out 


(E) nqueue 
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(D) equeue 
(V) iew 
(Quit 


Enter choice: e 


You picked: [e/ 


Enter new queue element: your dead! 


(E) nqueue 
(D) equeue 
(V) iew 
(Quit 


Enter choice: v 


You picked: [v] 
[ Bring out’, 'your dead!'] 


(E) nqueue 
(D) equeue 
(V) iew 
(Quit 


Enter choice: d 


You picked: [d/ 
Removed [ 'Bring out’ J 


(E) nqueue 
(D) equeue 
(V) iew 
(Quit 
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Enter choice: d 


You picked: [d/ 
Removed [ 'your dead!’ / 


(E) nqueue 
(D) equeue 
(V) iew 
(Quit 


Enter choice: d 


You picked: [d/ 
Cannot dequeue from empty queue! 


(E) nqueue 

(D) equeue 

(V) iew 
(Quit 


Enter choice: D You picked: [q] 


6.16 元 组 


实际 上 元 组 是 跟 列 表 非 常 相近 的 另 一 种 容器 类 型 . 元 组 和 列表 看 起 来 不 同 的 一 点 是 元 组 用 
的 是 圆 括号 而 列表 用 的 是 方 括号 。 而 功能 上 , 元 组 和 列表 相 比 有 一 个 很 重要 的 区 别 , 元 组 是 一 种 
不 可 变 类 型 . 正 因为 这 个 原因 , 元 组 能 做 一 些 列 表 不 能 做 的 事情 .. ， 用 做 一 个 字典 的 key. 另外 当 














有 着 如 此 多 的 共同 之 处 , 按照 这 种 讲法 我 们 会 重复 非 


一 组 对 象 时 , 这 个 组 默认 是 元 组 类 型 ， 











通常 情况 下 , 我 们 会 先 介绍 可 用 于 大 部 分 对 象 的 操作 符 和 内 建 函数 , 然后 是 介绍 针对 序列 类 
型 的 ， 最 后 是 总 结 一 下 仅 适 用 于 元 组 类 型 的 操作 符 和 内 建 函数 . 不 过 , 由 于 元 组 类 型 跟 列表 类 型 




















常 多 的 上 一 节 的 内 容 . 为 了 避免 太 多 重复 信 


息 , 我 们 会 讲解 元 组 和 列表 在 应 用 于 每 一 组 操作 符 和 内 建 函数 上 时 的 区 别 , 然后 讨论 一 下 元 组 的 
不 变性 以 及 其 他 独特 的 特性 . 
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如 何 创建 一 个 元 组 并 给 它 赋 值 

创建 一 个 元 组 并 给 他 赋值 实际 上 跟 创 建 一 个 列表 并 给 它 赋 值 完全 一 样 , 除了 一 点 , 只 有 一 个 
元 素 的 元 组 需要 在 元 组 分 割 符 里 面 加 一 个 逗号 (, ) 用 以 防止 跟 普 通 的 分 组 操作 符 混 淆 . 不 要 忘 了 
它 是 一 个 工厂 方法 ! 



































>» afuple = (123, 'abc', 4.56, l'inner', "tuple’], 7-9j) 
22» anotherTuple = (None, 'something to see here’) 
222 print afuple 

(123, 'abc', 4.56, [’ inner’, ’tuple’/, (7-9j)) 
222 print anotherTuple 

(None, 'something to see here’) 
2» emptiestPossibleTuple = (None, ) 
>>> print emptiestPossibleTuple 

(None, ) 

2» tuple( bar’) 

Ch’, la^, pl 


如 何 访问 元 组 中 的 值 
元 组 的 切片 操作 跟 列 表 一 样 , 用 方 括号 作为 切片 操 符 ( 口 ), 里 面 写 上 索引 值 或 者 索引 范围 ， 


>> aTuple[1:4]/ 
Cabec’, 4.56, [l inner’, 'tuple' /) 


2> aluplefz37 
(123, 'abc', 4 56) 
>» aTuple[3][1] 
'tuple' 


如 何 更 新 元 组 


跟 数字 和 字符 串 一 样 , 元 组 也 是 不 可 变 类 型 , 就 是 说 你 不 能 更 新 或 者 改变 元 组 的 元 素 , 在 6. 2 
和 6. 3.2 WEH, 我 们 是 通过 现 有 字符 串 的 片段 再 构造 一 个 新 字符 串 的 方式 解决 的 , 对 元 组 同样 
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需要 这 样 


2» afuple = afupleí0], aTuple[1], aTuple[-1] 
>>> afuple 

(123, tabo (7-9j)) 

2» tupl = (12, 34. 56) 

22^ tup2 = Capc 'xyz') 

222 tup? = tupl + tup2 

22^ tup3 

(12, 34.56, abc’, 'xyz ^) 





如 何 移 除 一 个 元 组 的 元 素 以 及 元 组 本 身 








删除 一 个 单独 的 元 组 元 素 是 不 可 能 的 , 当然 , 把 不 需要 的 元 素 丢 弃 后 ， 重 新 组 成 一 个 元 组 是 
没有 问题 的 . 
要 显示 地 删除 一 整个 元 组 , 只 要 用 del 语句 减少 对 象 引用 计数 . 当 这 个 引用 计数 达到 0 的 时 














候 , 该 对 象 就 会 被 析 构 . 记 住 , 大 多 数 时 候 , 我 们 不 需要 显 式 的 用 del 删除 一 个 对 象 , 一 出 它 的 作 
用 域 它 就 会 被 析 构 , Python 编程 里 面 用 到 显 式 删 除 元 组 的 情况 非常 之 少 . 
del afuple 











6.17 元 组 操作 符 和 内 建 函 数 
6.17.1 标准 类 型 操作 符 , 序列 类 型 操作 符 和 内 建 函 数 . 


元 组 的 对 象 和 序列 类 型 操作 符 还 有 内 建 函 数 跟 列表 的 完全 一 样 . 你 仍然 可 以 对 元 组 进行 切 
片 操作 , 合并 操作 , 以 及 多 次 找 贝 一 个 元 组 , 还 可 以 检查 一 个 对 象 是 否 属 于 一 个 元 组 , 进行 元 组 之 
间 的 比较 等 . 

















创建 , 重复 , 连接 操作 
»»ot-(l'xyz, 123], 23, -103.4) 
SX 


dim 
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(L xyz’, 123], 23, -103. 4) 

Ss £u 

(L xyz’, 123], 23, -103. 4, l'xyz, 123], 23, -103. 4) 
2D t =t + (free’, easy’) 

AE 

(L xyz’, 123], 23, -103.4, 'free', ’easy’) 


成 员 关 系 操 作 , 切片 操作 
222 28 in t 
True 
222 128 in t 
False 
222 tlol [1] 
128 
2 dll 
(23, -103.4, 'free', easy’) 





内 建 函 数 
222 str(t) 

(L xyz’, 123], 23, -103.4, 'free', 'easy') 

222^ len(t) 

5 

222^ max (t) 

’ free’ 

222^ min (t) 

—-103. 4 

2» emp(t, ([’xyz’, 123], 23, -103.4, 'free', 'easy')) 
0 

2 dist (ty) 

Il xyz’, 123], 23, —103.4, "free', “easy J 


操作 符 
Dro (4, 2 8 





© 
e 





> Bi 


Edit By Vheavens 





Edit By Vheavens 


«m, | 
< TS 





False 
MO L < Dl) 
True 
poe 2, d) = (3 -D 
False 
Mo (2 4) - (2 4 
True 


6.17.2 ”元 组 类 型 操作 符 和 内 建 函数 , 内 建 方法 

像 列表 一 样 元 组 也 没有 它 自己 专用 的 运算 符 和 内 建 函数 . 上 一 节 中 描述 的 列表 方法 都 跟 列 
表 对 象 的 可 变性 有 关 , 比如 说 排序 , 替换 , 添加 等 等 , 因为 元 组 是 不 可 变 的 , 所 以 这 些 操作 对 元 组 
来 说 就 是 多 余 的 , 这 些 方法 没有 被 实现 . 

















6.18 元 组 的 特殊 特性 . 
$ 6.18.1 不 可 变性 给 元 组 带 来 了 什么 影响 ? E: 


是 的 , 我 们 在 好 多 地 方 使 用 到 了 ”不 可 变性 “这 个 单词 , 除了 这 个 词 的 计算 机 学 科 定 义 和 实 现 ， 
从 应 用 的 角度 来 考虑 ， 这 个 词 的 底线 是 什么 ?一 个 数据 类 型 成 为 不 可 变 的 到 底 意 味 着 什么 ? 

在 三 个 标准 不 可 变 类 型 里 面 一 数字 , 字符 串 和 元 组 字符 串 一 元 组 是 受到 影响 最 大 的 , 一 个 数 
据 类 型 是 不 可 变 的 , 简单 来 讲 , 就 意味 着 一 旦 一 个 对 象 被 定义 了 , 它 的 值 就 不 能 再 被 更 新 , 除非 重 
新 创建 一 个 新 的 对 象 . 对 数字 和 字符 串 的 影响 不 是 很 大 , 因为 它们 是 标量 类 型 , 当 它 们 代表 的 值 
改变 时 ， 这 种 结果 是 有 意义 的 ， 是 按照 你 所 想 要 的 方式 进行 访问 的 ， 而 对 于 元 组 ， 事 情 就 不 是 
这 样 了 。 

因为 元 组 是 容器 对 象 ， 很 多 时 候 你 想 改 变 的 只 是 这 个 容器 中 的 一 个 或 者 多 个 元 素 ， 不 幸 的 
是 这 是 不 可 能 的 ， 切 片 操作 符 不 能 用 作 左 值 进 行 赋值 。 这 和 字符 串 没什么 不 同 ， 切 片 操 作 只 能 
用 于 只 读 的 操作 。 

不 可 变 并 不 是 坏事 ， 比 如 我 们 把 数据 传 给 一 个 不 了 解 的 API 时 ， 可 以 确保 我 们 的 数据 不 会 
被 修改 。 同 样 地 ， 如 果 我 们 操作 从 一 个 函数 返回 的 元 组 ， 可 以 通过 内 建 Dist 0 函数 把 它 转换 成 
一 个 列表 
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> - 


Edit By Vheavens 





Edit By Vheavens 


-e| 





T 





6.18.2 元 组 也 不 是 那么 “不 可 变 ” 


虽然 元 组 是 被 定义 成 不 可 变 的 ， 但 这 并 不 影响 它 的 灵活 性 。 元 组 并 不 像 我 们 想 的 那么 不 可 
变 ， 这 是 什么 意思 ? 其 实 元 组 几 个 特定 的 行为 让 它 看 起 来 并 不 像 我 们 先前 声称 的 那么 不 可 变 . 

比如 说 ， 既 然 我 们 可 以 把 字符 串 组 合 在 一 起 形成 一 个 大 字符 串 。 那 么 把 元 组 组 合 在 一 起 形 
成 一 个 大 的 元 组 也 没什么 不 对 ， 所 以 ， 连 接 操 作 可 用 ， 这 个 操作 一 点 都 没有 改变 那些 小 元 组 。 
我 们 所 作 的 是 把 它们 的 元 素 结合 在 一 起 . 这 里 有 几 个 例子 : 

















» s = first’ 
DD s = s +” second’ 


2205 s 

'first second’ 
225 
22> t = Cthird, fourth) 
225 f 

C third’, ’ fourth’) 

P2» 

>») t =t + CHE, sixth’) 
225 f 


C third’, ‘fourth’, 'fifth', 'sixth') 











同样 的 概念 也 适用 于 重复 操作 。 重 复 操 作 只 不 过 是 多 次 复制 同样 的 元 素 ， 再 有 ， 我 们 前 面 
提 到 过 可 以 用 一 个 简单 的 函数 调用 把 一 个 元 组 变 成 一 个 可 变 的 列表 。 我 们 的 最 后 一 个 特性 可 能 
会 吓 到 你 。 你 可 以 “修改 ”特定 的 元 组 元 素 ， 哇 ! 这 意味 着 什么 ? 
虽然 元 组 对 象 本 身 是 不 可 变 的 ， 但 这 并 不 意味 着 元 组 包含 的 可 变 对 象 也 不 可 变 了 。 








Mo t = (lxyz', 123], 23, -103.4) 
28 t 

(L xyz’, 123], 23, -103. 4) 

> t[0] [01] 

123 

222 t/[0] [1] = labe’, 'def'] 

M t 
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(L xyz’, ['abc', def J], 23, -103. 4) 








在 上 面 的 例子 中 , 虽然 t 是 一 个 元 组 类 型 变量 , 但 是 我 们 设法 通过 替换 它 的 第 一 个 元 素 (一 
个 列表 对 象 ) 的 项 来 “改变 ”了 它 。 我 们 蔡 换 了 t[0] (1), 原来 是 个 整数 ， 我 们 把 它 蔡 换 成 了 一 
个 列表 对 象 [ abc ，def ]. 虽然 我 们 只 是 改变 了 一 个 可 变 对 象 , 但 在 某 种 意义 上 讲 , 我 们 也 “ 改 
变 ” 了 我 们 的 元 组 类 型 变量 。 


6.18.3 默认 集合 类 型 


所 有 的 多 对 象 的 ， 喜 号 分 隔 的 ， 没 有 明确 用 符号 定义 的 ， 比 如 说 像 用 方 括 号 表示 列表 和 用 
圆 括号 表示 元 组 一 样 ， 等 等 这 些 集合 默认 的 类 型 都 是 元 组 ， 下 面 是 一 个 简单 的 示例 : 























222 ‘abc’, -4.24e93, 18+6. 6j, "xyz 
Cabc’, -4.24e4093, (1816. 6j), ° xyz’) 
222 


> x, y-l1 2 
>> X, y 
(1, 2) 


所 有 函数 返回 的 多 对 象 〈 不 包括 有 符号 封闭 的) 都 是 元 组 类 型 。 注 意 ， 有 符号 封装 的 多 对 
象 集合 其 实 是 返回 的 一 个 单一 的 容器 对 象 ， 比 如 : 














def fool(): 

MM objl, obj2, obj3 
def foo2(): 

— [objl, obj2, obj3] 
def foo3(: 


return (objl, obj2, obj3) 


E 
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上 面 的 例子 中 ，fool1 0 返回 3 个 对 象 ， 默 认 的 作为 一 个 包含 3 个 对 象 的 元 组 类 型 ，foo2 () 
一 个 单一 对 象 , 一 个 包含 3 个 对 象 的 列表 , 还 有 foo3 () 返回 一 个 跟 fool () 相同 的 对 象 . 唯一 








不 同 的 是 这 里 的 元 组 是 显 式 定义 的 . 











为 了 避免 令 人 讨厌 的 副作用 , 建议 总 是 显 式 的 用 圆 括号 表达 式 表 示 元 组 或 者 创建 一 个 元 组 . 


2254 26 8, 5E int, comparison, int 

(4, True, 5) 

25 (4, 2) < (3, 5) # tuple comparison 

False 

在 第 一 个 例子 中 小 于 号 的 优先 级 高 于 逗号 ，2<3 的 结果 成 了 元 组 变量 的 第 二 个 元 素 ， 适 当 








的 封装 元 组 就 会 得 到 希望 得 到 的 结果 . 


t 


6.18.4 单元 素 元 组 


曾经 试 过 创建 一 个 只 有 一 个 元 素 的 元 组 ?你 在 列表 上 试 过 , 它 可 以 完成 , 但 是 无 论 你 怎么 




















在 元 组 上 试验 ， 你 都 不 能 得 到 想 要 的 结果 。 


222 ['abc' ] 

['abc' ] 

DS» type(Í' abc']) # a list 

«type list’? 

225 

D> C xyz’) 

tos 

2^ type(( xyz )) £a string, not a tuple 
«type “str > 


或 许 你 筷 记 了 圆 括 号 被 重 载 了 ， 它 也 被 用 作 分 组 操作 符 。 由 圆 括号 包 右 的 一 个 单一 元 素 首 





先 被 作为 分 组 操作 ， 而 不 是 作为 元 组 的 分 界 符 。 一 个 变通 的 方法 是 在 第 一 个 元 素 后 面 添 一 个 过 








号 (, ) 来 表明 这 是 一 个 元 组 而 不 是 在 做 分 组 操作 . 
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C xyz’, ) 
6.18.5 字典 的 关键 字 
不 可 变 对 象 的 值 是 不 可 改变 的 。 这 就 意味 着 它们 通过 hash 算法 得 到 的 值 总 是 一 个 值 。 这 是 


作为 字典 键 值 的 一 个 必 备 条 件 。 在 下 一 章节 里 面 我 们 会 讨论 到 ， 刍 值 必须 是 可 哈 希 的 对 象 ， 元 
组 变量 符合 这 个 标准 ， 而 列表 变量 就 不 行 。 





























核心 笔记 : 列表 VS 元 组 

一 个 经 常会 被 问 到 的 问题 是 ，“ 为 什么 我 们 要 区 分 元 组 和 列表 变量 ?“ 这 个 问题 也 可 以 被 表 
述 为 “我 们 真 的 需要 两 个 相似 的 序列 类 型 吗 ? ” 一 个 原因 是 在 有 些 情况 下 , 使 用 其 中 的 一 种 类 
型 要 优 于 使 用 另 一 种 类 型 。 

最 好 使 用 不 可 变 类 型 变量 的 一 个 情况 是 ， 如 果 你 在 维护 一 些 敏感 的 数据 ， 并 且 需 要 把 这 些 
数据 传递 给 一 个 并 不 了 解 的 函数 (或 许 是 一 个 根本 不 是 你 写 的 API), 作为 一 个 只 负责 一 个 软件 
某 一 部 分 的 工程 师 ， 如 果 你 确信 你 的 数据 不 会 被 调用 的 函数 自 改 ， 你 会 觉得 安全 了 许多 。 

一 个 需要 可 变 类 型 参数 的 例子 是 , 如 果 你 在 管理 动态 数据 集合 时 。 你 需要 先 把 它们 创建 出 
来 ， 逐渐 地 或 者 不 定期 的 添加 它们 , 或 者 有 时 还 要 移 除 一 些 单个 的 元 素 。 这 是 一 个 必须 使 用 可 
变 类 型 对 象 的 典型 例子 。 幸 运 的 是 ， 通 过 内 建 的 1ist () 和 tuple () 转换 函数 , 你 可 以 非常 轻松 
的 在 两 者 之 间 进 行 转换 . 

list() 和 tuple 0 函数 允许 你 用 一 个 列表 来 创建 一 个 元 组 , 反之 亦 然 . 如 果 你 有 一 个 元 组 变 
E, 但 你 需要 一 个 列表 变量 因为 你 要 更 新 一 下 它 的 对 象 , 这 时 list () 函数 就 是 你 最 好 的 帮手 . 如 
果 你 有 一 个 列表 变量 , 并 且 想 把 它 传递 给 一 个 函数 , 或 许 一 个 APT, 而 你 又 不 想 让 任何 人 和 措 乱 你 
的 数据 , 这 时 tuple O 函数 就 非常 有 用 。 


6.19 ”相关 模块 
表 6. 12 列 出 了 与 序列 类 型 相关 的 关键 模块 , 这 个 列表 包含 了 前 面 我 们 间接 提 到 的 数组 模块 ， 


它 就 像 列表 类 型 ， 不 过 它 要 求 所 有 的 元 素 都 是 同一 类 型 。copy 模块 (可 以 参考 下 面 的 6. 20 47) 
负责 处 理 对 象 的 浅 拷贝 和 深 找 贝 。 









































Table 6.12 与 序列 类 型 相关 的 模块 


模块 内 容 
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数组 一 种 受 限 制 的 可 变 序 列 类 型 , 要 求 所 有 的 元 素 必 须 都 是 相同 的 类 型 。 
copy 提供 浅 拷贝 和 深 找 贝 的 能 力 ( 详 见 6. 20) 


operator 包含 函数 调用 形式 的 序列 操作 符 ， 比 如 operator. concat (m, n) 就 相当 于 连 








接 操作 (men) 。 
re Perl 风格 的 正则 表达 式 查 找 (和 [匹配 ) ; 见 第 15 章 
Stringl0/ 
cStringlO 把 长 字符 串 作 为 文件 来 操作 ， 比 如 read O, seek O 函数 等 , C. 版 的 更 快 一 些 ， 
但 是 它 不 能 被 继承 . 
Textwrap' FAVE ELSE / FE CAIN ERA, BAA% 
types 包含 Python 支持 的 所 有 类 型 


collections" 高 性 能 容器 数据 类 型 


a.  Python2. 3 新 加 














b. Python2. 4 新 加 
operator 模块 除了 提供 与 数字 操作 符 相 同 的 功能 外 ， 还 提供 了 与 序列 类 型 操作 符 相 同 的 
功能 . types 模块 是 代表 python 支持 的 全 部 类 型 的 type 对 象 的 引用 。 最 后 ，UserList 模块 包 
ET list 对 象 的 完全 的 类 实现 。 因 为 Python 类 型 不 能 作为 子 类 ， 所 以 这 个 模块 允许 用 户 获 得 
类 似 list 的 类 ， 也 可 以 派生 出 新 的 类 或 功能 。 如 果 你 熟悉 面向 对 象 编程 的 话 ， 我 们 强烈 推荐 你 
阅读 第 13 章 





6.20 拷贝 Python 对 象 
PS Wl FIRE 


在 前 面 的 3. 5 节 里 面 我 们 讲 过 对 象 赋值 实际 上 是 简单 的 对 象 引 用 。 也 就 是 说 当 你 创建 一 个 
对 象 ， 然 后 把 它 赋 给 另 一 个 变量 的 时 候 ，Python 并 没有 拷贝 这 个 对 象 ， 而 是 拷贝 了 这 个 对 象 的 
引用 。 

比如 ， 假 设 你 想 创 建 一 对 小 夫妻 的 通用 档案 ， 名 为 person. 然后 你 分 别 为 他 俩 拷贝 一 份 。 
在 下 面 的 例子 中 ， 我 们 展示 了 两 种 拷贝 对 象 的 方式 ， 一 种 使 用 了 切片 操作 ， 男 一 种 用 了 工厂 方 
法 ， 为 了 区 分 出 三 个 不 同 的 对 象 ， 我 们 使 用 id0 内 建 函 数 来 显示 每 个 对 象 的 标识 符 。( 我 们 还 
可 以 用 is 操作 符 来 做 相同 的 事情 























dim 
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22^ person = [ name’, [’ savings’, 100. 00/] 
22^ hubby = person[:] # slice copy 

22^ wifey = list(person) # fac func copy 

22^ [id(x) for x in person, hubby, wifey] 

[11826820, 12223552, 11850936] 





为 他 们 创建 了 初始 有 $100 的 个 人 存款 帐户 。 用 户 名 改 为 定制 的 名 字 。 但是， 当 丈 夫 取 走 $50 
后 ， 他 的 行为 影响 到 了 他 妻子 的 账户 ， 虽 然 我 们 进行 了 分 开 的 找 贝 作 当然， 前 提 是 我 们 希望 他 
们 每 个 人 都 拥有 自己 单独 的 帐号 ， 而 不 是 一 个 单一 的 联合 帐号 。) 为 什么 会 这 样 呢 ? 

















22^ hubby[0] = 'joe' 

2» wifeyí0] = ' jane’ 

>>> hubby, wifey 

(['joe', [’ savings’, 100. 0/], [’ jane’, [’ savings’, 100. 0/]) 


22» hubby[1]/[1] = 50. 00 
222 hubby, wifey 
(Ľ joe’, ['savings', 50.0/], [ jane’, [’ savings’, 50. 0/]) 


原因 是 我 们 仅仅 做 了 一 个 浅 拷贝 。 对 一 个 对 象 进行 浅 拷贝 其 实 是 新 创建 了 一 个 类 型 跟 原 对 
象 一 样 , 其 内 容 是 原来 对 象 元 素 的 引用 , 换 句 话说 , 这 个 拷贝 的 对 象 本身 是 新 的 , 但 是 它 的 内 容 不 
是 . 序列 类 型 对 象 的 浅 拷贝 是 默认 类 型 拷贝 , 并 可 以 以 下 几 种 方式 实施 : (1) 完 全 切片 操作 [:]，(2) 
利用 工厂 函数 , 比如 list O, dict (等, 3) 使 用 copy 模块 的 copy 函数 . 











你 的 下 一 个 问题 可 能 是 : 当 妻 子 的 名 字 被 赋值 , 为 什么 丈夫 的 名 字 没 有 受到 影响 ?难道 它们 
的 名 字 现 在 不 应 该 都 是 jane’ 了 吗 ?为 什么 名 字 没 有 变 成 一 样 的 呢 ? 怎 么 会 是 这 样 呢 ? 这 是 因为 
在 这 两 个 列表 的 两 个 对 象 中 , 第 一 个 对 象 是 不 可 变 的 (是 个 字符 串 类 型 ), 而 第 二 个 是 可 变 的 (一 
个 列表 ). 正 因为 如 此 , HETRE NN, 字符 串 被 显 式 的 拷贝 , 并 新 创建 了 一 个 字符 串 对 象 , 而 列 
表 元 素 只 是 把 它 的 引用 复制 了 一 下 , 并 不 是 它 的 成 员 . 所 以 改变 名 字 没 有 任何 问题 , 但 是 更 改 他 
们 银行 账号 的 任何 信息 都 会 引发 问题 . 现在 , 让 我 们 分 别 看 一 下 每 个 列表 的 元 素 的 对 象 ID 值 , 注 
意 , 银行 账号 对 象 是 同一 个 对 象 , 这 也 是 为 什么 对 一 个 对 象 进行 修改 会 影响 到 另 一 个 的 原因 . 注 
意 在 我 们 改变 他 们 的 名 字 后 , 新 的 名 字 字 符 串 是 如 何 蔡 换 原 有 " 名 字 字符 串 的 . 
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BEFORE: 

2» [id(x) for x in hubby/ 

[9919616, 11826320] 

2» [id(x) for x in wifey] 

[9919616, 11826320] 

AFTER: 

2» [id(x) for x in hubby] 

[12092832, 11826320] 

2» [id(x) for x in wifey] 

[12191712, L1826320] 

假设 我 们 要 给 这 对 夫妻 创建 一 个 联合 账户 , 那 这 是 一 个 非常 棒 的 方案 , 但 是 , 如 果 需 要 的 是 
两 个 分 离 账户 , 就 需要 作 些 改动 了 . 要 得 到 一 个 完全 拷贝 或 者 说 深 拷 贝 ~- 创 建 一 个 新 的 容器 对 象 ， 
包含 原 有 对 象 元 素 GHA) 全 新 拷贝 的 引用 一 需要 copy. deepcopy O 函数 . 我 们 使 用 深 拷贝 来 重 
写 整个 例子 . 



































22^ person = [ name’, [’ savings’, 100. 00/] 

2225 hubby = person 

222 import copy 

22^ wifey = copy. deepcopy (person) 

22^ [id(x) for x in person, hubby, wifey] 

[12242056, 12242056, 12224232] 

22^ hubby[0] = ’ joe’ 

2» wifey[0/ = ' jane’ 

222 hubby, wifey 

(/ joe’, [’ savings’, 100. 0/], [’ jane’, [’ savings’, 100. 0/]) 
>> hubby[I][I1] = 50. 00 

222 hubby, wifey 

(l joe’, [’ savings’, 50. 0//, [ jane’, [ savings’, 100. 0/]) 














这 就 是 我 们 想 要 的 方式 , 作为 验证 , 让 我 们 确认 一 下 所 有 四 个 对 象 都 是 不 同 的 . 








22^ [id(x) for x in hubby] 
/[12191712, 11826280] 


dim 
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2» [id(x) for x in wifey/ 
[12114080, 12224792] 


以 下 有 几 点 关于 拷贝 操作 的 警告 。 第 一 , 非 容 器 类 型 (比如 数字 , 字符 串 和 其 他 “原子 “类 型 的 
WA, 像 代 码 , 类 型 和 xrange 对 象 等 ) 没 有 被 拷贝 一 说 , 浅 拷贝 是 用 完全 切片 操作 来 完成 的 . 第 二 ， 
如 果 元 组 变量 只 包含 原子 类 型 对 象 , 对 它 的 深 堵 贝 将 不 会 进行 . 如 果 我 们 把 账户 信息 改 成 元 组 类 
型 , 那么 即便 按 我 们 的 要 求 使 用 深 找 贝 操作 也 只 能 得 到 一 个 浅 找 贝 : 




















22^ person = [ name’, ( savings’, 100.00)] 
22^ newPerson = copy. deepcopy (person) 

2» [id(x) for x in person, newPerson/ 
[12225352, 12226112] 

2» [id(x) for x in person/ 

[9919616, 11800088] 

2» [id(x) for x in newPerson/ 


[9919616, 11800088] 
核心 模块 : copy Ed 
我 们 刚才 描述 的 浅 拷贝 和 深 拷 贝 操作 都 可 以 在 copy 模块 中 找到 . 其 实 copy 模块 中 只 有 两 

个 函数 可 用 :copy (进行 浅 拷贝 操作 , 而 deepcopy () 进行 深 拷 贝 操作 . 


6.21 序列 类 型 小 结 


序列 类 型 为 数据 的 顺序 存储 提供 了 几 种 机 制 . 字符 串 是 最 常用 的 数据 载体 , 无 论 是 用 于 给 用 
户 显 示 , 存 贮 到 硬盘 , 通过 网 络 传输 , 还 是 作为 一 个 多 源 信息 的 容器 . 列表 和 元 组 提供 了 容器 存储 
能 力 , 允许 简单 的 操作 和 访问 多 个 对 象 , 无 论 它 们 是 Python 的 对 象 还 是 用 户 自 定义 的 对 象 . 单一 
元 素 或 一 组 元 素 可 以 通过 持续 有 序 地 索引 偏 移 进 行 切片 操作 来 访问 . 总 之 , 这 些 数据 类 型 为 你 的 
Python 开发 环境 提供 了 灵活 而 易 用 的 存 贮 工具 . 我 们 用 表 6. 13-- 序 列 类 型 的 操作 符 , 内 建 函数 
和 方法 的 摘要 列表 来 总 结 本 章 . 
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Table 6.13 序列 类 型 操作 符 , 内 建 函 数 和 方法 
Table 6.13 Sequence Type Operators, Built-in Functions 





and Methods 





Operator, Built-in 


Function or Method String List Tuple 
[] (list creation) . 
0 . 
ww . 
append () . 
capitalize() . 
center () . 
chr () . 
cmp () . > . 
count ( ) E . 
decode() . 
encode () " 
endswith () e 


(continued) 


e+- 
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Table 6.13 Sequence Type Operators, Built-in Functions 





and Methods (continued) 
Operat or, Built-in 
Function or Method String List Tuple 
expandtabs |) . 
extend() . 
find() . 
hex() . 
indexí) . . 
insert () . 
isdecimal () . 
isdigit() . 
islowerí) . 
isnumeric() . 
isspace() . 
istitle() . 
isupper () . 
join() : 
len() . . . 
list() . . E 
ljust() . 
lower () . 
lstrip() . 
maxí) . . E 
min() . . . 
oct() . 
ord() . 





e+- 
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Table 6.13 Sequence Type Operators, Built-in Functions 
and Methods (continued) 





Operator, Built-in 


Function or Method String List Tuple 
upper () . 
zfill{) . 
. (attributes) . s 
[] (slice) . . 
[:] . . è 
* a - = 
E . 
+ 。 。 。 
in t . . 


z not in * . . 4 
6.22 AY 


6-1. FRE. string 模块 中 是 否 有 一 种 字符 串 方法 或 者 函数 可 以 帮 有 我 鉴定 一 下 一 个 字符 串 
是 否 是 另 一 个 大 字符 串 的 一 部 分 ? 





6-2. ”字符 串 标识 符 . 修改 例 6-1 的 idcheck. py 脚本 , 使 之 可 以 检测 长 度 为 一 的 标识 符 , 并 且 
可 以 识别 Python 关键 字 , 对 后 一 个 要 求 , 你 可 以 使 用 keyword 模块 (特别 是 keyword. kelist) 来 帮 你 . 








6-3. HEFT 
(a) 输入 一 串 数字 , 从 大 到 小 排列 之 . 
(b) ER a 一 样 , 不 过 要 用 字典 序 从 大 到 小 排列 之 . 





6-4. GOR. 更 新 上 一 章 里 面 你 的 得 分 测试 练习 方案 , 把 测试 得 分 放 到 一 个 列表 中 去 . 你 的 代 
码 应 该 可 以 计算 出 一 个 平均 分 , 见 练习 2-9 和 练习 5-3. 


6-5. ZFF 


(a) 更 新 你 在 练习 2-7 里 面 的 方案 , 使 之 可 以 每 次 向 前 向 后 都 显示 一 个 字符 串 的 一 个 字符 . 
(b) 通过 扫描 来 判断 两 个 字符 串 是 否 匹 配 (不 能 使 用 比较 操作 符 或 者 cmp O 内 建 函 数 ) 。 附 加 题 : 


4 a 
+- aa +e 
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t 
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ee 





在 你 的 方案 里 加 入 大 小 写 区 分 . 
(c) 判断 一 个 字符 串 是 否 重 现 (后 面 跟前 面 的 一 致 ). 附加 题 ， 在 处 理 除 了 严格 的 回 文 之 外 , 加 入 对 
例如 控制 符号 和 空格 的 支持 。 
(d) 接受 一 个 字符 , 在 其 后 面 加 一 个 反 向 的 拷贝 , 构成 一 个 回 文字 符 串 . 




















6-6. 字符 串 .创建 一 个 string. strip OO 的 蔡 代 函数 :接受 一 个 字符 串 , 去 掉 它 前 面 和 后 面 的 
空格 (如 果 使 用 string. *strip (0 函数 那 本 练习 就 没有 意义 了 ) 








6-7. 调试 .看 一 下 在 例 6. 5 中 给 出 的 代码 (buggy. py) 

(a) 研究 这 段 代 码 并 描述 这 段 代 码 想 做 什么 . 在 所 有 的 CH) 处 都 要 填写 你 的 注释 . 

(b) 这 个 程序 有 一 个 很 大 的 问题 , 比如 输入 6, 12, 20, 30, 等 它 会 死 掉 , 实际 上 它 不 能 处 理 任何 的 偶 
(c) 修正 (b) 中 提出 的 问题 . 











6-8. 列表 . 给 出 一 个 整数 值 , 返回 代表 该 值 的 英文 ,比如 输入 89 返回 “eight-nine”。 附 加 题 : 
能 够 返回 符合 英文 语法 规则 的 形式 ， 比 如 输入 “89” 返 回 “eighty-nine”。 本 练习 中 的 值 限 定 在 家 0 
到 1, 000. 


6-9. 转换. 为 练习 5-13 写 一 个 姊妹 函数 ， 接 受 分 钟 数 ， 返 回 小 时 数 和 分 钟 数 ， 总 时 间 不 








变 , 并 且 要 求 小 时 数 尽 可 能 
6 - 10. 字符 串 . 写 一 个 函数 , 返回 一 个 跟 输 入 字符 串 相 似 的 字符 串 , 要 求 字符 串 的 大 小 写 反 转 . 
比如 , 输入 “Mr. Ed”, 应 该 返回 “mR. eD” 作 为 输出 . 











Example 6.4 有 bug 的 程序 (buggy. py) 


这 是 一 个 用 于 练习 6-7 的 程序 , 判断 这 个 程序 是 干什么 的 , FER” 人 处 添加 你 的 注释 , 找 出 其 中 的 错 
误 , 并 修改 之 . 


7 #//usr/bin/env python 

2 

3 # 

4 num str = raw input( Enter a number: ') 
5 

6 # 

7 num num = int(num str) 

8 

9g 

10 fac list = range(1, num num*l) 
11 print “BEFORE:”, 'fac list! 
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12 

13 8 

i4i-0 

15 

16 # 

I7 while i « len(fac list): 
18 

19 # 

20 if num num % fac list[i] == 0: 
21 del fac_list[i] 

22 

23 # 

2Ai=i+l 

25 

26 # 

27 print 'AFTER:^, 'fac list’ 





6 - 11. 转换 
(a) 创建 一 个 从 整数 到 TP 地 址 的 转换 程序 , 如 下 格式 : WWW. XXX. YYY. ZZZ. 
(b) 更 新 你 的 程序 , 使 之 可 以 逆转 换 . 





6 - 12. 字符 串 
(a) 创建 一 个 名 字 为 findchr O 的 函数 , 函数 声明 如 下 : 
def findchr(string, char) 
findchr () 要 在 字符 串 string 中 查找 字符 char, 找到 就 返回 该 值 的 索引 , 否则 返回 -1. 不 能 
string. *find() 或 者 string. *index O 函数 和 方法 
(b) 创建 男 一 个 叫 rfindchr() 的 函数 , 查找 字符 char 最 后 一 次 出 现 的 位 置 . "ERR. findchr O 工作 
类 似 , 不 过 它 是 从 字符 串 的 最 后 开始 同 前 查找 的 . 
(c) 创 建 第 三 个 函数 , 名 字 叫 subchr 0 , 声明 如 下 : 
def subchr(string, origchar, newchar) 
subchr () SR. findchr O 类似, 不同 的 是 , 如 果 找 到 匹配 的 字符 就 用 新 的 字符 蔡 换 原先 字符 . 返回 
修改 后 的 字符 串 . 




















6-13. 字符 串 . string 模块 包含 三 个 函数 , atoi 0, atol O, 和 atof 0 , 它们 分 别 负责 把 字符 串 转 

换 成 整数 , 长 整 型 , 和 浮 点 型 数字 . 从 Python. 5 起 , Python 的 内 建 函 数 int O, longQ, float (也 可 以 

做 相同 的 事 了 ，complex 0 函数 可 以 把 字符 串 转 换 成 复数 . (然而 1 5 之 前 , 这 些 转换 函数 只 能 工作 于 
数字 之 上 ) 

string 模块 中 并 没有 实现 一 个 atoc O 函数 , 那么 你 来 实现 一 个 , atoc () , 接受 单个 字符 串 做 参 

数 输入 , 一 个 表示 复数 的 字符 串 , 例如 ,”-1. 23e+4-5. 67j ,返回 相应 的 复数 对 象 . 你 不 能 用 eval 0 ER 

数 , 但 可 以 使 用 complex () 函数 , 而且 你 只 能 在 如 下 的 限制 之 下 使 用 complex O :complex (real, imag) 
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HJ real 和 imag 都 必须 是 浮 点 值 . 





6 - 14. 随机 数 . 设计 一 个 “石头 , BC, Fi” WERK, AEN XLI Rochambeau”, 你 小 时 候 可 能 玩 过 , 下 面 
是 规则 . 你 和 你 的 对 手 , 在 同一 时 间 做 出 特定 的 手势 , 必须 是 下 面 一 种 手势 :石头 , 剪子 , 布 . 胜利 者 从 


下 面 的 规则 中 
(a) the 





产生 , 这 个 规则 本 身 是 个 悖 论 . 
paper covers the rock, 


布 包 石 头 . 


(b) Akh 





By, 





(c) 剪子 剪 破 布 . 在 你 的 计算 机 版 本 中 , 用 户 输入 她 /他 的 选项 , 计算 机 找 一 个 随机 选项 , 然后 由 你 
的 程序 来 决定 一 个 胜利 者 或 者 平手 . 注意 :最 好 的 算法 是 尽量 少 的 使 用 if 语句 . 








6-15. 转换 
(a) 给 出 两 个 可 识别 格式 的 日 期 , 比如 MM/DD/YY 或 者 DD/MM/YY 格式 , 计算 出 两 个 日 期 间 的 天 





(b) 给 出 一 个 人 的 生日 , 计算 从 此 人 出 生 到 现在 的 天 数 , 包括 所 有 的 国 月 . 





(ce) 还 是 上 面 的 例子 , 计算 出 到 此 人 下 次 过 生日 还 有 多 少 天 . 








6 - 16. 矩阵 . AREXE BE M 和 NN 的 加 和 乘 操作 . 











移 除 列表 的 最 新 一 个 元 素 , 并 返回 它 . 


6 - 17. 方 法 . 实现 一 个 叫 myPop 0 的 函数 , 功能 类 似 于 列表 的 pop 0 方法 , 用 一 个 列表 作为 输入 ， 





6-18. zip) 内 建 函 数 ”在 6.13.2 节 里 面 关于 zip0 函数 的 例子 中 ,zip (fn, 1n) 返 回 的 是 什么 ? 


6-19. 多 





列 输出 . 有 任意 项 的 序列 或 者 其 他 容器 , 把 它们 等 距离 分 列 显示 . 由 调用 者 提供 数据 和 





输出 格式 . 例如 , 如 果 你 传 入 100 个 项 并 定义 3 列 输出 , 按照 需要 的 模式 显示 这 些 数 据 . 这 种 情况 下 , 应 
该 是 两 列 显示 33 个 项 , 最 后 一 列 显 示 34 个 . 你 可 以 让 用 户 来 选择 水 平 排序 或 者 垂直 排序 . 
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本 章 中 ， 我 们 来 讨论 Python 语言 中 的 映射 类 型 和 集合 类 型 。 和 前 面 的 章节 一 样 ， 我 们 首先 做 一 
个 介绍 ， 然 后 在 来 讨论 可 用 操作 符 ， 工 三 函数 、 内 建 函 数 (BIF) 和 方法 。 然 后 我 们 再 来 看 看 每 种 数据 
类 型 的 详细 用 法 。 








7. 1 映射 类 型 字典 





字典 是 Python 语言 中 唯一 的 映射 类 型 。 映 射 类 型 对 象 里 哈 希 值 ( 键 ) 和 指向 的 对 象 UE) 
多 的 关系 。 它们 与 Perl 中 的 哈 希 类 型 ( 译 者 注 : 又 称 关联 数组 ) 相似 , 通常 被 认为 是 可 变 的 哈 希 表 。 
一 个 字典 对 象 是 可 变 的 ， 它 是 一 个 容器 类 型 ， 能 存储 任意 个 数 的 Python 对 象 ， 其 中 也 包括 其 他 容器 
类 型 。 字 典 类 型 和 序列 类 型 容器 类 (列表 、 元 组 ) 的 区 别 是 存储 和 访问 数据 的 方式 不 同 。 序 列 类 型 只 
用 数字 类 型 的 键 ( 从 序列 的 开始 起 按 数 值 顺序 索引 ) 。 映 射 类 型 可 以 用 其 他 对 象 类 型 做 键 ; 一 般 最 党 
见 的 是 用 字符 串 做 键 keys) 。 和 序列 类 型 的 键 不 同 ， 映 射 类 型 的 键 keys) 直接 ， 或 间接 地 和 存储 的 
数据 值 相关 联 。 但 因为 在 映射 类 型 中 ， 我 们 不 再 用 “序列 化 排序 “的 键 (keys), 所 以 映射 类 型 中 的 数据 
是 无 序 排列 的 。 



































显然 ， 这 并 不 影响 我 们 使 用 映射 类 型 ， 因 为 映射 类 型 不 要 求 用 数字 值 做 索引 以 从 一 个 容器 中 获 
取 对 应 的 数据 项 。 你 可 以 用 键 (key) 直接 “映射 ”到 值 ， 这 就 是 为 什么 叫 映 射 类 型 (“mapping type") 
的 原因 。 了 映射 类 型 通常 被 称 做 哈 希 表 的 原因 是 字典 对 象 就 是 哈 希 类 型 的 。 字 典 是 Python 中 最 强大 的 
数据 类 型 之 一 。 











核心 笔记 : 什么 是 哈 希 表 ? 它们 与 字典 的 关系 是 什么 ? 
序列 类 型 用 有 序 的 数字 键 做 索引 将 数据 以 数组 的 形式 存储 。 一 般 ， 索 引 值 与 所 存储 的 数据 毫 无 
关系 。 还 可 以 用 男 一 种 方式 来 存储 数据 : 基于 某 种 相关 值 ， 比 如 说 一 个 字符 串 。 我 们 在 日 常生 活 中 
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一 直 这 么 做 。 你 把 人 们 的 电话 号 码 按照 他 们 的 姓 记 录 在 电话 籍 上 ， 你 按照 时 间 在 日 历 或 约会 筹 上 添 
加 事件 ， 等 等 。 在 这 些 例子 中 ， 你 的 键 (key) 就 是 和 数据 项 相关 的 值 。 

哈 希 表 是 一 种 数据 结构 : 它 按 照 我 们 所 要 求 的 去 工作 。 哈 希 表 中 存储 的 每 一 条 数据 ， 叫 做 一 个 
值 (value) ， 是 根据 与 它 相 关 的 一 个 被 称 作为 键 (key) 的 数据 项 进行 存储 的 。 键 和 值 合 在 一 起 被 称 为 
“ 键 - 值 Xt” (key-value pairs). ” 哈 希 表 的 算法 是 获取 键 ， 对 键 执行 一 个 叫做 哈 希 函数 的 操作 ， 
并 根据 计算 的 结果 ， 选 择 在 数据 结构 的 某 个 地 址 中 来 存储 你 的 值 。 任 何 一 个 值 存 储 的 地 址 皆 取 决 于 
它 的 键 。 正 因为 这 种 随意 性 ， 哈 希 表 中 的 值 是 没有 顺序 的 。 你 拥有 的 是 一 个 无 序 的 数据 集 。 

你 所 能 获得 的 有 序 集合 只 能 是 字典 中 的 键 的 集合 或 者 值 的 集合 .方法 Keys 0 或 values() 返回 
一 个 列表 ， 该 列表 是 可 排序 的 。 你 还 可 以 用 items 0 方法 得 到 包含 键 、 值 对 的 元 组 的 列表 来 排序 。 
由 于 字典 本 身 是 哈 希 的 ， 所 以 是 无 序 的 。 

哈 希 表 一 般 有 很 好 的 性 能 ， 因为 用 键 查询 相当 快 。 


Python 的 字典 是 作为 可 变 的 哈 希 表 实 现 的 。 如 果 你 熟悉 Perl 的 话 ， 就 可 以 发 现 字 典 与 Perl 中 
的 “关系 数组 “或 散 列 相似 。 








现在 我 们 就 来 研究 Python 字典 。 一 个 字典 条 目的 语法 格式 是 键 : 值 。 而 且 ， 多 条 字典 条 目 
被 包含 在 ( { } ) 里 。 


如 何 创建 字典 和 给 字典 赋值 


创建 字典 只 需要 把 字典 赋值 给 一 个 变量 ， 不 管 这 个 字典 是 否 包含 元 素 : 


229 dict1 = (Q 

2» dict2 = [ name’: ’earth’, 'port': 80) 
>>> dictl, dict2 

(Q, f port’: 80, 'name': 'earth'J) 


























从 Python 2. 2 版 本 起 ， 可 以 用 工矿 方法 dictO 来 创建 字典 。 当 我 们 详细 讨论 dict O 的 时 候 
会 看 到 更 多 的 例子 ， 现 在 来 看 一 个 小 例子 : 





A» fdict = dict((x', 1], Cy, 2p) 
M» fdict 
ly: 2 "xXx 1} 











从 Python 2.3 版 本 起 ， 可 以 用 一 个 很 方便 的 内 建 方法 fromkeys O. 来 创建 一 个 “默认 ， 字 
典 中 元 素 具有 相同 的 值 (如 果 没 有 给 出 ， 默认 为 None) : 




















22» ddict = (].fromkeys((x' , °y’), -D 
225 ddict 
Cy: -L 'x': -L 
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225 

22^ edict = (]. fromkeys(( foo’, 'bar')) 
225^ edict 

{’ foo’: None, 'bar': None} 





如 何 访问 字典 中 的 值 














要 想 授 历 一 个 字典 (一 般 用 键 )， 你 只 需要 循环 查看 它 的 键 ， 像 这 样 : 





2» dict2 = l'name': 'earth', 'port': 80) 
225 
2222 for key in dict2. keys: 
print ’key=%s, value=%s’ % (key, dict2[key/) 


key-name, value=earth 
key=port, value=80 




















从 Python 2.2 开始 ， 你 可 以 不 必 再 用 keys () 方 法 获取 供 循 环 使 用 的 键 值 列表 了 。 可 以 
用 和 迭代 器 来 轻松 地 访问 类 序列 对 象 (sequence-like objects) ， 比 如 字典 和 文件 。 只 需要 用 字 
典 的 名 字 就 可 以 在 for 循环 里 遍历 字典 。 





2» dict2 = [ name’: 'earth', 'port': 80} 
2 
22255 for key in dict2: 
print ’key=%s, value=%s’ % (key, dict2[key/) 


key-name, value=earth 
key=port, value=80 








要 得 到 字典 中 某 个 元 素 的 值 ， 可 以 用 你 所 熟悉 的 字典 键 加 上 中 括号 来 得 到 : 


2 dict2[’ name’ ] 

'earth' 

222 

2» print 'host %s is running on port %d’ % | 
(dict2[’ name’ ], dictZ('port' J) 

host earth is running on port 80 





字典 dictl 是 空 的 ， 字 典 dict2 有 两 个 数据 元 素 。 字 典 dict2 WHEE ' name’ Fl’ port’, EAN 
对 应 的 值 分 别 是 earth” 和 80。 就 像 你 看 到 的 ， 通 过 键 name’ 可 以 得 到 字典 中 的 元 素 的 值 。 
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如 果 我 们 想 访问 该 字典 中 的 一 个 数据 元 素 ， 而 它 在 这 个 字典 中 没有 对 应 的 键 ， 将 会 产生 一 个 错 











222 dict2[’ server’ ] Traceback (innermost last): 
File “<stdim”*, line l, in ? 
KeyError: server 


在 这 个 例子 中 ， 我 们 试图 获得 字典 中 ” server 键 所 对 应 的 值 。 你 从 上 面 的 代码 知道 ，” server’ 
这 个 键 并 不 存在 。 检 查 一 个 字典 中 是 否 有 某 个 键 的 最 好 方法 是 用 字典 的 has_key 0 〇 方法 ， 或 者 另 一 
种 比较 好 的 方法 就 是 从 2.2 版 本 起 用 的 ，in EX not in 操作 符 。 has keyO 方法 将 会 在 未 来 的 
Python 版 本 中 弃 用 ， 所 以 用 in 或 not in 是 最 好 的 方法 。 


























下 面 我 们 将 介绍 字典 所 有 的 方法 。 方 法 has key OU in 以 及 not in 操作 符 都 是 布尔 类 型 的 。 
对 于 前 两 者 而 言 ， 如 果 字 典 中 有 该 键 就 返回 真 (True)， 否则 返回 假 (False) 。(Python 2. 3 版 本 以 前 ， 
没有 布尔 和 常量， 为 真 时 返回 1， 假 时 返回 0。) 




















222^ ‘server’ in dict2 # HÜ dict2. has key( server’) 
False 

2» 'name' in dict # K dictZ has key (C name’) 
True 

222» dict2[’ name’ ] 

earth’ 








一 个 字典 中 混用 数字 和 字符 串 的 例子 : 


S»» dict8 = (Q 

2 dict3[1] = abc’ 

2» dict3['1'] = 3. 14159 

2» dict3[3. 2] = xyz’ 

252^ dict3 

(3.2; xyz’, l: abe’, “1°: 3. 14159) 


除了 逐一 地 添加 每 个 键 - 值 对 外 ， 我 们 也 可 以 给 dict3 整体 赋值 。 





diet? = 19,2: '"xym', d: (abe, (© 3 14159) 





如 果 事 先 已 经 知道 所 有 的 数据 就 可 以 用 键 - 值 对 来 创建 一 个 字典 (这 是 显而易见 的 ) 。 
dict3 的 示例 说 明 你 可 以 采用 各 种 类 型 的 数据 作为 字典 的 键 。 如 果 我 们 被 问 到 是 否 
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值 的 键 (key) 时 ， 你 可 能 会 说 ,“ 不 ” xm? 














为 什么 在 执行 中 字典 中 的 键 不 允许 被 改变 呢 ? 你 这 样 想 就 会 明白 : ”比方 说 ， 你 创建 了 一 个 字 
典 ， 字 典 中 包含 一 个 元 素 (一 个 键 和 一 个 值 ) 。 可 能 是 由 于 某 个 变量 的 改变 导致 键 发 生 了 改变 。 这 时 
候 你 如 果 用 原来 的 键 来 取出 字典 里 的 数据 ， 会 得 到 KeyError (因为 键 的 值 已 经 改变 了 )， 现 在 你 没 办 
法 从 字典 中 获取 该 值 了 ， 因 为 键 本 身 的 值 发 生 了 变化 。 由 于 上 面 的 原因 ， 字 典 中 的 键 必须 是 可 哈 希 
的 ， 所 以 数字 和 字符 串 可 以 作为 字典 中 的 键 ， 但 是 列表 和 其 他 字典 不 行 。( 见 7.5.2 小 节 字典 的 
键 必须 是 可 哈 希 的 ) 


















































如 何 更 新 字典 





你 可 以 通过 以 下 几 种 方式 对 一 个 字典 做 修改 : L eR i 
修改 一 个 已 存在 的 数据 项 ， 或 删除 一 个 已 存在 的 数据 项 (下 面 有 关于 数据 项 删除 操作 的 详细 讲述 


2» dictZ['name'] = 'venus' # #e#AEAFA 

2» dict2[’ port’] = 6969 # ÆW CAZA 

2» dict2[’ arch’ ] = ’sunos5’# HEA 

P» 

2» print post %(name)s is running on port %(port)d’ %dict2 








host venus is running on port 6969 

如 果 字 典 中 该 键 已 经 存在 ， 则 字典 中 该 键 对 应 的 值 将 被 新 值 蔡 代 。 上 面 的 print WER SA 
一 种 在 字典 中 使 用 字符 串 格 式 符 ( 的 方法 。 用 字典 参数 可 以 简化 print 语句 ， 因 为 这 样 做 你 只 须 
用 到 一 次 该 字典 的 名 字 ， 而 不 用 在 每 个 元 素 出 现 的 时 候 都 用 元 组 参数 表示 。 











你 也 可 以 用 内 建 方法 update 0 〇 0 将 整个 字典 的 内 容 添加 到 男 一 个 字典 。 我 们 将 在 7.4 节 介 绍 此 
方法 。 


如 何 删除 字典 元 素 和 字典 
删除 整个 字典 的 操作 不 常见 。 通常 ， 你 删除 字典 中 的 单个 元 素 或 是 清除 整个 字典 的 内 容 。 但 是 ， 


如 果 你 真 想 "删除 一 个 字典 ， 用 del 语句 (介绍 见 小 节 3.5.5). 以 下 是 删除 字典 和 字典 元 素 的 例 
T. 











del dict2[’name’] # PIREN "name" HEA 

dict2. clear () # ME dict2 PHA HEA 

del dict2 E ARES dict! FH 

dict2. pop( name’) # WAHIB PIREN "name" HEA 
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核心 笔记 : 避免 使 用 内 建 对 象 名 字 作 为 变量 的 标识 符 

如 果 在 Python 2.3 前 , 你 已 经 开始 使 用 Python, 你 可 能 用 dict 作为 一 个 字典 的 标识 符 。 但 是 ， 
因为 dict) 现在 已 成 为 Python 的 类 型 和 工厂 方法 ， 重 载 dict 0 会 给 你 带 来 廊 烦 和 潜在 的 bugs. 
编译 器 允许 你 做 这 样 的 重 载 , 它 认 为 你 是 聪明 的 , 知道 自己 正在 做 什么 ! 小 心 。 请 不 要 用 dict, list, 
file, bool, str, input, len 这 样 的 内 建 类 型 为 变量 命名 。 


7. 2 映射 类 型 操作 符 





字典 可 以 和 所 有 的 标准 类 型 操作 符 一 起 工作 , 但 却 不 支持 像 拼 接 Cconcatenation) 和 重复 
Crepetition) 这 样 的 操作 。 这 些 操作 对 序列 有 意义 ， 可 对 映射 类 型 行 不 通 。 在 接 下 来 的 两 小 节 里 ， 
我 们 将 向 你 讲述 字典 中 的 操作 符 。 











7. 2. 1 标准 类 型 操作 符 


标准 类 型 操作 符 已 在 第 四 章 介绍 。 下 面 是 一 些 使 用 操作 符 的 简单 示例 : 


222 dict4 = (l'abc': 123} 


22 dicto = ('abc': 456} 
ASS dict6 = (labe : 123, 98.6: 37} 
2 dict7 = l xyz’: 123} 


222 dict4 < dictó 

True 

25» (dict4 < dict6) and (dict4 < dict?) 
True 

ASS (dicto < dictó) and (dicts < dict?) 
True 

222 dictó < dict? 

False 


字典 是 如 何 比 较 的 呢 ? 与 列表 和 元 组 一 样 ， 这 个 过 程 比 数字 和 字符 串 的 比较 更 复杂 些 。 详 细 
算法 请 见 第 7.3.1 小 节 。 





7. 2. 2 映射 类 型 操作 符 





字典 的 键 碍 找 操作 符 《〈[ D 
键 查找 操作 符 是 唯一 仅 用 于 字典 类 型 的 操作 符 ， 它 和 序列 类 型 里 单一 元 素 的 切片 (slice) 操 作 符 
很 相 象 。 对 序列 类 型 来 说 ， 用 索引 做 唯一 参数 或 下 标 (subscript) 以 获取 一 个 序列 中 茶 个 元 素 的 值 。 

















$ 
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对 字典 类 型 来 说 ， 是 用 键 (key) 查询 (字典 中 的 元 素 ), 所 以 键 是 参数 (argument), ， 而 不 是 一 个 索引 
(index) 。 键 查找 操作 符 既 可 以 用 于 给 字典 赋值 ， 也 可 以 用 于 从 字典 中 取 值 : 














d[k] = v 通过 键 'k” ， 给 字典 中 某 元 素 赋值 v 
d[k] 通过 键 'k ” ， 查 询 字 典 中 某 元 素 的 值 


( 键 ) 成 员 关 系 操作 ( in , not in) 
从 Python 2.2 起 ， 程 序 员 可 以 不 用 has key 0 方法， 而 用 in 和 not in 操作 符 来 检查 某 个 键 
是 否 存在 于 字典 中 : 





2» 'name' in dict2 
True 
>> 'phone' in dict2 
False 


7.3 映射 类 型 的 内 建 函数 和 工厂 函数 


7.3.1 标准 类 型 函数 [type() 、str () 和 cmp O ] : 





如 你 所 料 ， 对 一 个 字典 调用 typeO 工厂 方法 ， 会 返回 字典 类 型 ， “<type dict >”. 调用 
str O 工 三 方法 将 返回 该 字典 的 字符 串 表 示 形 式 ， 这 些 都 很 容易 理解 。 

在 前 面 的 三 个 章节 里 , 我 们 已 经 讲述 了 用 cmp 0 内 建 函 数 来 操作 数字 、 字符 串 、 列 表 和 元 组 。 
那么 字典 又 是 如 何 比 较 的 呢 ? 字典 是 通过 这 样 的 算法 来 比较 的 : 首先 是 字典 的 大 小 ， 然 后 是 键 ， 最 
后 是 值 。 可 是 ， 用 cmp 0 做 字典 的 比较 一 般 不 是 很 有 用 。 









































接 下 来 的 小 节 里 ， 将 进一步 详细 说 明 字典 比较 的 算法 ， 但 这 部 分 是 高 层次 的 阅读 内 容 ， 可 以 跳 
过 ， 因 为 字典 的 比较 不 是 很 有 用 也 不 常见 。 




















# 字 典 比 较 算 法 
接 下 来 的 例子 中 ， 我 们 建立 两 个 字典 进行 比较 ， 然 后 慢 慢 修改 ， 来 看 看 这 些 修改 对 它们 之 间 的 
比较 带 来 的 影响 : 


》>>aret7 = Q 
2» dict2 = { host’: earth’, 'port': 80} 
25» emp(dictl, dictZ) 














Edit By Vheavens 


Edit By Vheavens 


ee 
+ | t 


2s Gietil host | earth’ 
25» emp(dictl, dictZ) 
=] 





在 第 一 个 比较 中 ，dictl Eb dict2 小 ， 因 为 dict2 有 更 多 元 素 (2 个 vs. 0 个 ) ÆW dictl 添 
加 一 个 元 素 后 ，dictl 仍然 比 dict2 小 (2 vs. D, ， 虽 然 添 加 的 元 素 在 dict2 中 也 存在 。 





2» dictlí('port'] = 8080 
25» emp(dictl, dictZ) 

1 

2» dict1[’ port’ ] = 80 
25» emp(dictl, dictZ) 

0 


在 向 dictl 中 添加 第 二 个 元 素 后 ， 两 个 字典 的 长 度 相 同 ， 所 以 用 键 比 较 大 小 。 这 时 键 相等 ， 则 
通过 它们 的 值 比 较 大 小 。 键 “host 的 值 相同 ,对 于 键 “ port’ ,dictl 中 值 比 dict2 中 的 值 大 (8080 vs. 
80). JE dict2 中 port 的 值 设 成 和 dictl 中 的 值 一 样 ， 那 么 两 个 字典 相等 ， 它们 有 相同 的 大 小 、 
相同 的 键 、 相 同 的 值 ， 所 以 cmpO 返回 值 是 0。 

{ 译 者 注 : ”原文 有 误 : dict2 is deemed larger because its value is greater than that of 
dictl' s’ port’ key (8080 vs. 80). M: dictlis deemed larger because its value is greater 
than that of dict2' s 'port' key (8080 vs. 80). ] 























2 dietil prot | =" tep’ 
2» emp(dictl, dictZ) 

1 

2 diGLEI prob d = udp’ 
2» emp(dictl, dictZ) 

=] 


当 向 两 个 字典 中 的 任何 一 个 添加 新 元 素 时 ， 这 个 字典 马上 会 成 为 大 的 那个 字典 ， 就 像 例子 中 的 
dict] 一 样 。 向 dict2 添加 键 - 值 对 后 ， 因 为 两 个 字典 的 长 度 又 相等 了 ， 会 继续 比较 它们 的 键 和 值 。 








oU edict = f fruits’ rl) 
29» ddict = L fruits’ :1} 
25^ emp(cdict, ddict) 


cdictí oranges’ ] = 0 
ddict[’ apples’ ] = 0 
cmp (cdict, ddict) 
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上 面 的 例子 表明 cmp O 可 以 返回 除 -1, 0, 1 外 的 其 他 值 。 算 法 按照 以 下 的 顺序 


(1) 比较 字典 长 度 

如 果 字 — 典 的 长 度 不 同 , 那么 用 emp(dietl, dict2) 比较 大 小 时 , 如 果 字 典 dictl 比 dict2 K, 
cmp() 返 回 正 值 ， 如 果 dict2 LK dictl 长 ， 则 返回 负 值 。 也 就 是 说 ， 字 典 中 的 键 的 个 数 越 多 ， 这 个 
字典 就 越 大 ， 即 : 

len(dictl) > len(dictZ) ==> dictl > dict2 

(2) 比较 字典 的 键 

如 果 两 个 字典 的 长 度 相 同 ， 那 就 按 字 典 的 键 比 较 ; 键 比较 的 顺序 和 keys () 方 法 返回 键 的 顺序 相 
同 。 (注意 : 相同 的 键 会 映射 到 哈 希 表 的 同一 位 置 ， 这 保证 了 对 字典 键 的 检查 的 一 致 性 。) 这 时 ， 
如 果 两 个 字典 的 键 不 匹配 时 ， 对 这 两 个 (不 匹配 的 键 ) 直接 进行 比较 。 当 dictl 中 第 一 个 不 同 的 键 大 
T dict2 中 第 一 个 不 同 的 键 ，cmp 0 会 返回 正 值 。 

(3) 比较 字典 的 值 

如 果 两 个 字典 的 长 度 相 同 而 且 它 们 的 键 也 完全 匹配 ， 则 用 字典 中 每 个 相同 的 键 所 对 应 的 值 进行 
比较 。 一 旦 出 现 不 匹配 的 值 ， 就 对 这 两 个 值 进行 直接 比较 。 若 dictl LK dict2 中 相同 的 键 所 对 应 的 
IEK, cmp 0 会 返回 正 值 。 

(4) Exact Match 

到 此 为 止 , 即 ， 每 个 字典 有 相同 的 长 度 、 相 同 的 键 、 每 个 键 也 对 应 相同 的 值 ， 则 字典 完全 匹配 ， 
返回 0 值 。 


7-1 说 明了 上 述 字 典 比较 的 算法 
^ START with ~ 
Cth rie 


Comparing dictionaries 





























return(cmp(len(dictl),len(dict2)) 


return (cmp (dictlKeyN,dict2KeyN) ) 


return (cmp (dict1ValN,dict2ValN) ) 
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图 7-1 字典 是 如 何 进行 比较 的 





7. 3. 2 映射 类 型 相关 的 函数 


dict () 

工厂 函数 被 用 来 创建 字典 。 如 果 不 提供 参数 ， 会 生成 空 字典 。 当 容器 类 型 对 象 做 为 一 个 参数 传 
递 给 方法 dict () 时 很 有 意思 。 如 果 参 数 是 可 以 迭代 的 ， 即 ， 一 个 序列 ， 或 是 一 个 迭代 器 ， 或 是 一 个 
支持 欠 代 的 对 象 ， 那 每 个 可 迭代 的 元 素 必 须 成 对 出 现 。 在 每 个 值 对 中 ， 第 一 个 元 素 是 字典 的 键 、 第 
二 个 元 素 是 字典 中 的 值 。 见 Python 文档 里 关于 diet O 的 例子 : 
































2 det(Gip(x, "y (1, 23 

fy :2 x: L 

D dict ([C x, Xy 217) 

ieee. YI 

M» diet([ xy [i-1], i) for i in range (1, 3) J) 
ÉFy:2x: d 


+ 如 果 输 入 参数 是 CR) 一 个 映射 对 象 ， 比 如 ， 一 个 字典 对 象 ， 对 其 调用 dict O 会 从 存在 的 字典 里 è 

复制 内 容 来 生成 新 的 字典 。 新 生成 的 字典 是 原来 字典 对 象 的 浅 复制 版 本 ， 它 与 用 字典 的 内 建 方法 
copy) 生成 的 字典 对 象 是 一 样 的 。 但 是 从 已 存在 的 字典 生成 新 的 字典 速度 比 用 copy 0 〇 方法 慢 , 我 们 
推荐 使 用 copy O 。 


























从 Python 2.3 开始 , 调用 dict 0 方法 可 以 接受 字典 或 关键 字 参 数字 典 (函数 操作 符 , 第 11 EE): 








2» dict (r=1, y=2) 
{yo Wu 

222 dict8 = dict (x=1, y=2) 
22^ dicté 

C d cu uy 

22^ dict9 = dict (**dict8) 
25^ dict 9 

Peo a. wy 


我 们 提醒 读者 dict9 的 例子 只 作为 了 解 dict 0 方法 的 用 途 ， 它 不 是 现实 中 的 例子 。 使 用 下 面 这 
些 行 的 方法 更 聪明 (效率 更 好 ) : 





222^ dict9 = dict&. copy O 
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>>> dict9 
ly: 2, "x^ 1j 





len() 
AER len QO (RIG. CHEFA PNR GS E (在 本 章 的 后 面 我 们 会 看 到 ) 。 对 字典 
调用 len 0) ， 它 会 返回 所 有 元 素 ( 键 - 值 对 ) 的 数目 : 











2» dict2 = [ name’: 'earth', 'port': 80] 
22^ dictZ 

lport': 80, 'name': 'earth'] 

2^» len(dictZ) 

2 





我 们 前 面 提 到 字典 中 的 元 素 是 没有 顺序 的 。 从 上 面 的 例子 中 可 以 看 到 ，dict2 的 元 素 显 示 的 顺序 
和 输入 时 的 顺序 正 相反 。 


hash Q 








AGER tash OE ACER ROSA TEE 但 它 可 以 判断 某 个 对 象 是否 可 以 做 一 个 字典 的 
键 。 将 一 个 对 象 作为 参数 传递 给 hash()， 会 返回 这 个 对 象 的 哈 希 值 。 只 有 这 个 对 象 是 可 哈 希 的 ， E 








uc. 回 值 是 整数 ， 不 产生 错误 或 异常 ) 。 


如 果 用 比较 操作 符 来 比较 两 个 数值 ， 发 现 它们 是 相等 的 ， 那 么 即使 二 者 的 数据 类 型 不 同 ， 它 
们 也 会 得 到 相同 的 哈 希 值 。 





如 果 非 可 哈 希 类 型 作为 参数 传递 给 hash 0 方法 ,会 产生 TypeError 错误 (因此 ， 如果 使 用 这 样 的 
对 象 作为 键 给 字典 赋值 时 会 出 错 ) : 








>>> hash([]) 

Traceback (innermost last): File “<stdin>”, line l, in ? 
TypeError: list objects are unhashable 

225 

22» dict2[ 0] = 'foo' 

Traceback (most recent call last): File ^Xstdim^^, line 1, in ? 
TypeError: dict objects are unhashable 


FERS 7. 1 中 ， 我 们 列 出 以 下 三 个 映射 类 型 的 相关 函数 。 


表 7.1 映射 类 型 的 相关 函数 
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函数 操作 

dict ([container]) 创建 字典 的 工厂 函数 。 如 果 提 供 了 容器 类 (container) ， 就 
用 其 中 的 条 目 填充 字典 ， 否 则 就 创建 一 个 空 字典 。 

len (mapping) 返回 映射 的 长 度 ( 键 - 值 对 的 个 数 ) 

hash (obj) 返回 obj 的 哈 希 值 














7.4 映射 类 型 内 建 方法 








字典 提供 了 大 量 方法 来 帮 你 做 事情 ， 见 表 7. 2. 








下 面 ， 我 们 说 明 字 典 的 一 些 很 常见 的 方法 。 在 上 面 的 例子 里 ， 我 们 已 经 看 到 has_key() 和 它 的 
SRA in 和 not in。 如 我 们 在 7. 1 小 节 看 到 ， 试 图 查找 一 个 字典 里 没有 的 键 值 会 产生 KeyError 


Ee 
FF Bo 

















基本 的 字典 方法 关注 他 们 的 键 和 值 。 它 们 有 : keys 0 方法， 返回 一 个 列表 ， 包 含 字典 中 所 有 的 
键 ，values WO 方法， 返回 一 个 列表 ， 包 含 字典 中 所 有 的 值 ，items ()， 返 回 一 个 包含 所 有 ( 键 ， 值 ) 元 
组 的 列表 。 这 些 方法 在 不 按 任何 顺序 吉 历 字典 的 键 或 值 时 很 有 用 。 


























2225 dictZ keys () 

['port', 'name'] 

222 

2» dict2 values Q 

[80, 'earth'] 
222 
> dict2 items Q 

[Cport/, 80), (name’, 'earth')] 
225 
2» for eachKey in dictZ. keys: 
print 'dict2 key’, eachKey, “has value’, dictZ[eachKey] 


dict2 key port has value 80 


dict2 key name has value earth 

















keys () 方 法 很 有 用 ， 它 返回 一 个 包含 字典 中 所 有 键 的 列表 ， 此 方法 可 以 与 for 循环 一 起 使 用 来 

















获取 字典 中 的 值 。 
dé 7.2 字典 类 型 方法 
方法 名 字 操作 
dict. clear*() 删除 字典 中 所 有 元 素 
dict. copy O 返回 字典 ( 浅 复制 ) 的 一 个 副本 


dict. fromkeys' (seq, 


E 











$— 一 * 一 
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val=None) ° 


dict. get (key, 
default=None) ° 


dict. has key (key) 
dict. items () 
dict. keys () 


dict. iter 0° 


dict. pop’ (key 
[, default]) ° 
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创建 并 返回 一 个 新 字典 ， 以 seq 中 的 元 素 做 该 字典 的 键 ，val 做 该 字 
典 中 所 有 键 对 应 的 初始 值 (如 果 不 提供 此 值 ， 则 默认 为 None) 


























对 字典 dict 中 的 键 key, 返回 它 对 应 的 值 value， 如 果 字 典 中 不 存在 此 
键 ， 则 返回 default 的 值 (注意 ， 参 数 default 的 默认 值 为 None) 
如 果 键 (key) 在 字典 中 存在 , 返回 True, 否则 返回 False， 在 Python2. 2 
版 本 引入 in 和 not in 后 ， 此 方法 几乎 已 废弃 不 用 了 ， 但 仍 提 供 一 个 
可 工作 的 接口 。 
返回 一 个 包含 字典 中 ( 键 ， 值 ) 对 元 组 的 列表 
返回 一 个 包含 字典 中 键 的 列表 
方法 iteritems(, iterkeys(), itervaluesQ 与 它们 对 应 的 非 迭 代 方 法 
一 样 ， 不 同 的 是 它们 返回 一 个 迭代 子 ， 而 不 是 一 个 列表 。 




















和 方法 get O 相似 ， 如 果 字 典 中 key 键 存在 ， 删 除 并 返回 dict[key]， 
如 果 key 键 不 存在 ， 且 没有 给 出 default 的 值 ， 引 发 KeyError 异常 。 





dict. setdefault (key, 


default-None)* 








和 方法 set O 相似， 如 果 字 典 中 不 存在 key 键 ， 由 dict[key]-default 为 
它 赋值 。 





dict. update (dict2)” 将 字典 dict2 的 键 - 值 对 添加 到 字典 dict 


dict. values () 


a. Python 1.5 新 
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Python 2.3 新 
Python 2.2 新 
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Python 2.0 新 


TE OE 


返回 一 个 包含 字典 中 所 有 值 的 列表 * 


H 














但 是 ， 它 返回 的 元 素 是 没有 顺序 的 (和 哈 希 表 中 的 键 keys) 一 样 ) ， 我 们 通常 希望 它们 能 按 某 种 


方式 排序 。 

















在 Python 2.4 版 本 以 前 , 你 只 能 调用 字典 的 keys 0 方法 获得 键 的 列表 , 然后 调用 列表 的 sort 0 








方法 得 到 一 个 有 序 可 遍历 的 列表 。 现 在 特别 为 运 代 子 设计 了 一 个 名 为 sorted O WA ££ PR, "ER IR] 


一 个 有 序 的 和 欠 代 子 : 





22^ for eachKey in sorted(dictZ): 
. print 'dict2 key’, eachKey, “has value’, 


dictZ[eachKey 


dict2 key name has value earth 
dict2 key port has value 80 





[e— 
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update WO 方法 可 以 用 来 将 一 个 字典 的 内 容 添加 到 另外 一 个 字典 中 。 字 典 中 原 有 的 键 如 果 与 新 添 
加 的 键 重复 ， 那 么 重复 键 所 对 应 的 原 有 条 目的 值 将 被 新 键 所 对 应 的 值 所 履 盖 。 原 来 不 存在 的 条 目 则 
被 添加 到 字典 中 。clear 0 方法 可 以 用 来 删除 字典 中 的 所 有 的 条 目 。 


























2^ dictZ- l'host':'earth', port’ :80} 

2» dict8= ('host':'venus', 'server':'http'] 

25» dict2. update (dict3) 

225^ dictZ 

l'server': 'http', 'port': 80, 'host': 'venus'] 

222^ dicts. clear () 

222^ dict3 

0 

copyO 方法 返回 一 个 字典 的 副本 。 ERIK A Ae Hill. 关于 浅 复 制 和 深 复 制 请 阅读 小 节 6. 19. 
最 后 要 说 明 ，get O 方法 和 键 查 找 (key-lookup) 操作 符 ( [ ] ) 相似 ， 不 同 的 是 它 允 许 你 为 不 存在 的 
键 提 供 默认 值 。 如 果 该 键 不 存在 ， 也 未 给 出 它 的 默认 值 ， 则 返回 None 。 此 方法 比 采 用 键 查找 
(key-lookup) 更 灵活 ， 因 为 你 不 必 担 心 因 键 不 存在 而 引发 异常 。 


















































22» dict4 = dict2. copy Ó 
>>> dict4 
{ server’: 'http', 'port': 80, 'host': 'venus'] 
22» dict4. get ( host’) 
* venus” 
222 dict4. get ( xxx’) 
2252 type (dict4. get C xxx’)) 
«type ° None’ > 
222 dict4. get ( xxx’, 'no such key’) 
'no such key’ 








setdefault OZÉ E 2.0 才 有 的 内 建 方法 ， 使 得 代码 更 加 简洁 ， 它 实现 了 和 常用 的 语法 : 检查 字典 
中 是 否 含有 某 键 。 如 果 字 典 中 这 个 键 存 在 ， 你 可 以 取 到 它 的 值 。 如 果 所 找 的 键 在 字典 中 不 存在 ， 
你 可 以 给 这 个 键 赋 默 认 值 并 返回 此 值 。 这 正 是 执行 setdefault 0 方法 的 目的 : 

















2» myDict = Chost’: earth’, 'port': 80} 
222^ myDict. keys (0) 

[ host’, 'port'] 

222 myDict. items () 

[Chost’, 'earth'), (port’, 80)] 

222 myDict. setdefault ( port’, 8080) 
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2» myDict. setdefault ( prot’, 'tcep') 

0p’ 

222 myDict. items () 

[( prot’, 'tep'), Chost’, 'earth'), (port', 80)/ 











前 面 ， 我 们 曾 简 要 介绍 过 fromkeys () 方 法 ， 下 面 是 更 多 的 示例 : 


22^ [ll]. fromkeys ( xyz’) 

Cy’: None, 'x': None, 'z': None? 

225 

2» (].fromkeys(( love’, 'honor'), True) 
{’love’: True, 'honor': True} 





HAT, keysO, items), 和 values (方法 的 返回 值 都 是 列表 。 数 据 集 如 果 很 大 会 导致 很 难 
处 理 ， 这 也 正 是 iteritems ()，iterkeys()， 和 itefrvalues O 方法 被 添加 到 Python 2.2 的 主要 原 
因 。 这 些 函 数 与 返回 列表 的 对 应 方法 相似 ， 只 是 它们 返回 惰性 赋值 的 迭代 器 ， 所 以 节省 内 存 。 未 来 
的 Python 版 本 中 ， 甚 至 会 更 灵活 ， 那 时 这 些 方法 将 会 返回 强大 的 对 象 ， 暂 叫做 视图 (views)。 视 图 
(views) 是 访问 容器 对 象 的 接口 集 。 举 例 来 说 ， 你 可 以 从 一 个 视图 (views) 中 删除 某 个 字典 的 键 ， 从 
而 改变 某 个 字典 。 


$ 7.5 字典 的 键 


字典 中 的 值 没 有 任何 限制 。 他 们 可 以 是 任意 Python 对 象 ， 即 ， 从 标准 对 象 到 用 户 自 定义 对 象 
是 字典 中 的 键 是 有 类 型 限制 的 。 






































7. 5. 1 不 允许 一 个 键 对 应 多 个 值 

你 必须 明确 一 条 原则 ， 每 个 键 只 能 对 应 一 个 项 。 也 就 是 说 ， 一 键 对 应 多 个 值 是 不 允许 的 。( 像 列 
表 、 元 组 和 其 他 字典 这 样 的 容器 对 象 是 可 以 的 。 ) 当 有 键 发 生 冲 突 (D, 字典 键 重复 赋值 ), 取 最 后 (最 
近 ) 的 赋值 。 




















Ww 




















DS” diet! = l foo’ 2789. "foo : "xys j 
225^ dicti 

f'foo': 'xyz'] 

225 

2 dictI[’ toa 7 = 123 

225 dicti 

{’ foo’: 123] 

















Edit By Vheavens 


Edit By Vheavens 


ee 





Python 并 不 会 因 字 上 典 中 的 键 存在 冲突 而 产生 一 个 错误 ， 它 不 会 检查 键 的 冲突 是 因为 ， 如 果真 这 
样 做 的 话 ， 在 每 个 键 - 值 对 赋值 的 时 候 都 会 做 检查 ， 这 将 会 占用 一 定量 的 内 存 。 在 上 面 的 例子 里 ， 键 
"foo’ 被 列 出 两 次 ，Python 从 左 到 右 检查 键 - 值 对 。 首 先 值 789 被 赋值 (给 键 foo 所 对 应 的 值 ) ， 然 后 
又 很 快 被 字符 串 ' xyz’ 蔡 代 。 当 给 字典 中 一 个 不 存在 的 键 赋 值 时 ， 键 和 值 会 被 创建 和 添加 ， 但 如 果 该 
键 已 经 存在 ( 键 冲突 )， 那 此 键 所 对 应 的 值 将 被 蔡 换 。 上 面 例子 中 ， 键 “foo” 所 对 应 的 值 被 替换 了 两 
UG 最 后 的 赋值 语句 ， 值 123 RE SE xyz’ 。 















































1. 5. 2 键 必须 是 可 哈 希 的 





我 们 在 小 节 7. 1 说 过 ， 大 多 数 Python 对 象 可 以 作为 键 ; 但 它们 必须 是 可 哈 希 的 对 象 。 像 列表 和 
字典 这 样 的 可 变 类 型 ， 由 于 它们 不 是 可 哈 希 的 ， 所 以 不 能 作为 键 。 











所 有 不 可 变 的 类 型 都 是 可 哈 希 的 , 因此 它们 都 可 以 做 为 字典 的 键 。 一 个 要 说 明 的 是 问题 是 数字 : 
值 相 等 的 数字 表示 相同 的 键 。 换 句 话 来 说 ， 整 型 数字 1 和 浮 点 数 1.0 的 哈 希 值 是 相同 的 ， 即 它们 
是 相同 的 键 。 














同时 ， 也 有 一 些 可 变 对 象 (很 少 ) 是 可 哈 希 的 ， 它们 可 以 做 字典 的 键 , 但 很 少见 。 举 一 个 例子 ， 
一 个 实现 了 _hash 0 特殊 方法 的 类 。 因 为 _hash 0 方法 返回 一 个 整数 ， 所 以 仍然 是 用 不 可 变 

















的 值 (做 字典 的 键 ) 。 * 
为 什么 键 必须 是 可 哈 希 的 ? 解释 器 调用 哈 希 函数 ， 根 据 字典 中 键 的 值 来 计算 存储 你 的 数据 的 位 

置 。 如 果 键 是 可 变 对 象 ， 它 的 值 可 改变 。 如 果 键 发 生变 化 ， 哈 希 函 数 会 映射 到 不 同 的 地 址 来 存储 数 

据 。 如 果 这 样 的 情况 发 生 ， 哈 希 函数 就 不 可 能 可 靠 地 存储 或 获取 相关 的 数据 。 选 择 可 哈 希 的 键 的 原 

因 就 是 因为 它们 的 值 不 能 改变 。( 此 问题 在 Python FAQ 中 也 能 找到 答案 ) 




















我 们 知道 数字 和 字符 串 可 以 被 用 做 字典 的 键 ， 但 元 组 又 怎么 样 呢 ? 我 们 知道 元 组 是 不 可 变 的 ， 
但 在 小 节 6. 17. 2， 我 们 提示 过 它们 也 可 能 不 是 一 成 不 变 的 。 用 元 组 做 有 效 的 键 ， 必 须要 加 限制 : 元 
组 中 只 包括 像 数 字 和 字符 串 这 样 的 不 可 变 参 数 ， 才 可 以 作为 字典 中 有 效 的 键 。 




















我 们 用 一 个 程序 (userpw. py 例 7.1), 来 为 本 章 关 于 字典 的 讲述 做 个 小 结 。 这 个 程序 是 用 于 
理 用 户 名 和 密码 的 模拟 登录 数据 系统 。 脚 本 接受 新 用 户 的 信息 : 


D 











示例 7.1 字典 示例 (userpw. py) 

















这 个 程序 管理 用 于 登录 系统 的 用 户 信息 : 登录 名 字 和 密码 。 登 录用 户 帐 号 建立 后 ， 已 存在 用 户 
可 以 用 登录 名 字 和 密码 重 返 系统 。 新 用 户 不 能 用 别人 的 登录 名 建立 用 户 帐号 。 











1#//usr/bin/env python 


$ 
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3db = [j 

4 

5def newuser(): 

6 prompt = 'login desired: ' 
7 while True: 





8 name = raw input (prompt) 
9 If db. has key (name): 
10 prompt = 'name taken, try another: ' 
11 continue 
12 else: 
13 break 
14 pwd = raw input( passwd: ') 
15 db[name] = pwd 
16 
17 def olduser(): 
18 name = raw input( login: ') 
19 pwd = raw input( passwd: ') 
20 passwd = db. get (name) 
21 if passwd == pwd: 
22 print ‘welcome back’, name 
23 else: 
24 print 'login incorrect’ 
25 
26 def showmenu(): 
27 eub 46 


28 (New User Login 
29 (E)xisting User Login 
30 (Quit 


Example 7.1 Dictionary Example (userpw.py) (continued) 


31 

32 Enter choice: ^^^ 

33 

34 done = False 

Du while not done: 

36 

37 chosen = False 
38 while not chosen: 


try. 
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40 choice = raw input (prompt). strip 0 [0]. lower O 
4] except (EOFError, KeyboardInterrupt) : 

42 choice = 'q' 

43 print '|nYou picked: [%s/’ % choice 

44 if choice not in ‘neq’: 

45 print “invalid option, try again’ 

46 else: 

47 chosen = True 

49 done = True 


50 newuser () 

o1 olduser() 

32 

53 if name  -- ' main 
54 showmenu () 














他 们 提供 登录 名 和 和 密码。 帐号 建立 后 ， 已 存在 用 户 可 用 登录 名 和 正确 的 密码 重 返 系统 。 新 用 户 
不 能 用 别人 的 登录 名 建立 帐号 。 














Lines 1-3 
在 Unix 初始 行 后 , 我 们 用 一 个 空 用 户 数据 库 初 始 化 程序 。 因为 我 们 没有 把 数据 存储 在 任何 地 
方 ， 每 次 程序 执行 时 都 会 新 建 一 个 用 户 数据 库 。 











Lines 5-15 

newuser() 函数 用 来 建立 新 用 户 。 它 检查 名 字 是 否 已 经 存在 ， 如 果 证 实 是 一 个 新 名 字 ， 将 要 求 
用 户 输入 他 或 她 的 密码 (我 们 这 个 简单 的 程序 没有 加 密 ) ， 用 户 的 密码 被 存储 在 字典 里 ， 以 他 们 的 名 
字 做 字典 中 的 键 。 


























Lines 17 - 24 

olduser O PG BARB [BEES] HI PA. B FP FH LEES HIP RUE ERE, FTW E. AU 
知 用 户 是 无 效 登 录 并 返回 菜单 。 我 们 不 会 采用 一 个 无 限 循环 来 提示 用 户 输入 正确 的 密码 ， 因 为 用 户 
可 能 会 无 意 进 入 错误 的 菜单 选项 。 






































Lines 26 - 51 

真正 控制 这 个 脚本 的 是 showmenu () 函数 ， 它 显示 给 用 户 一 个 友好 界面 。 提 示 信 息 被 包括 在 三 引 
号 里 (““”)， 这 样 做 是 因为 提示 信息 跨 多 行 ， 而 且 比 单行 包含 ' \n 符号 的 字符 串 更 容易 处 理 。 菜 单 显 
示 后 ,， 它 等 待 用 户 的 有 效 输 入 ,然后 根据 采 单 选项 选择 操作 方式 。try-expect 语句 和 上 音 stack. py 
queue. py 例子 里 的 一 样 ( 见 小 节 6. 14. 1). 
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Lines 53 - 54 
如 果 这 个 脚本 被 直接 执行 (不 是 通过 import 方式 )， 这 行 代码 会 调用 showmenu O 函数 运行 程序 。 
这 是 我 们 的 脚本 运行 结果 : 











$ userpw. py 

(N)ew User Login 
(E)xisting User Login 
(Quit 


Enter choice: n 


You picked: [n] 
login desired: king arthur 


passwd: grail 


(N)ew User Login 
(E)xisting User Login 
(Quit 


Enter choice: e 


You picked: [e] 
login: sir knight 
passwd: flesh wound 
login incorrect 


(N)ew User Login 
(E)xisting User Login 
(Quit 


Enter choice: e 


You picked: [e/ 

login: king arthur 
passwd: grail 

welcome back king Arthur 


(Mew User Login 
(E)xisting User Login 
(Quit 
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Enter choice: D 
You picked: [q/ 





7.6 集合 类 型 


数学 上 ， 把 set 称 做 由 不 同 的 元 素 组 成 的 集合 ， 集 合 (set) 的 成 员 通 常 被 称 做 集合 元 素 (set 
elements) 。Python 把 这 个 概念 引入 到 它 的 集合 类 型 对 象 里 ,集合 对 象 是 一 组 无 序 排列 的 可 哈 希 的 值 。 
是 的 ,集合 成 员 可 以 做 字典 中 的 键 。 数 学 集合 转 为 Python 的 集合 对 象 很 有 效 , 集 合 关 系 测试 和 union、 
intersection 等 操作 符 在 Python 里 也 同样 如 我 们 所 预想 地 那样 工作 。 

















和 其 他 容器 类 型 一 样 ， 集 合 支持 用 in 和 not in 操作 符 检 查 成 员 ， 由 len) 内 建 函 数 得 到 集 
合 的 基数 (大 小 )， 用 for 循环 兴 代 集合 的 成 员 。 但 是 因为 集合 本 身 是 无 序 的 ， 你 不 可 以 为 集合 创建 
索引 或 执行 切片 (slice) 操 作 ， 也 没有 键 (keys) 可 用 来 获取 集合 中 元 素 的 值 。 























EEG (sets) 有 两 种 不 同 的 类 型 ， 可 变 集 合 (set) 和 不 可 变 集 合 (frozenset) 。 如 你 所 想 ， 对 可 
变 集合 (set)， 你 可 以 添加 和 删除 元 素 ， 对 不 可 变 集合 (frozenset) 则 不 允许 这 样 做 。 请 注意 ， 可 变 
RA (set) 不 是 可 哈 希 的 ， 因 此 既 不 能 用 做 字典 的 键 也 不 能 做 其 他 集合 中 的 元 素 。 不 可 变 集合 
(frozenset) 则 正好 相反 ， 即 ， 他 们 有 哈 希 值 ， 能 被 用 做 字典 的 键 或 是 作为 集合 中 的 一 个 成 员 。 




















集合 (Sets) 最 早出 现在 Python2. 3 版 本 中 ， 通 过 集合 (sets) 模块 来 创建 ， 并 通过 ImmutableSet 
类 和 Set 类 进行 访问 。 而 后 来 ， 大 家 都 认为 把 它们 作为 内 建 的 数据 类 型 是 个 更 好 的 主意 ， 因 此 这 些 
类 被 用 C 重 写 改进 后 包含 进 Python2. 4。 关 于 集合 类 型 和 这 些 类 改进 的 更 多 内 容 ， 可 阅读 此 文 获得 详 
情 : PEP 218， 链 接地 址 : http://python. org/peps/pep-0218. html. 














虽然 现在 集合 类 型 已 经 是 Python 的 基本 数据 类 型 了 ， 但 它 经 常会 以 用 户 自 定义 类 的 形式 出 现在 
各 种 Python 程序 中 ， 就 像 复 数 一 样 ( 复 数 从 Pythonl. 4 版 本 起 成 为 python 的 一 个 数据 类 型 )， 这 样 
重复 的 劳动 已 数不胜数 了 。 在 现在 的 Python 版 本 之 前 ，( 即 使 集合 类 型 对 许多 人 的 程序 来 说 并 不 是 
最 理想 的 数据 结构 ，) 许 多 人 仍然 试图 给 列表 和 字典 这 样 的 Python 标准 类 型 添加 集合 功能 ， 这 样 可 
以 把 它们 作为 真正 集合 类 型 的 代理 来 使 用 。 因 此 现在 的 使 用 者 有 包括 “真正 ”集合 类 型 在 内 的 多 种 
选择 。 





























在 我 们 详细 讲述 Python 的 集合 对 象 之 前 ,我 们 必须 理解 Python 中 的 一 些 数学 符号 ( 见 表 7. 3), 
这 样 对 术语 和 功能 有 一 个 清晰 的 了 解 。 











表 7.3 集合 操作 符 和 关系 符号 
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数学 符号 Python 符号 说 明 
€ as 是 .. .的 成 员 
€ not in 不 是 . . .的 成 员 
= == 等 于 
: = 不 等 于 
c « A... BY OP 
~ <= 是 .. .的 子 集 ( 包 括 非 严 格子 集 ) 
> > 是 ... 的 (严格 ) 超 集 
= >= 是 .. .的 超 集 (包括 非 严 格 超 集 ) 
^ & 交集 
ARX n 差 补 或 相对 锌 集 
对 称 差分 


7.6 集合 类 型 


s 如 何 创 建 集合 类 型 和 给 集合 赋值 





集合 与 列表 ( [ ] ) 和 字典 ( (3 ) 不 同 ， 没 有 特别 的 语法 格式 。 列 表 和 字典 可 以 分 别 用 他 们 自 
己 的 工厂 方法 list) 和 dict) 创建 ， 这 也 是 集合 被 创建 的 唯一 方法 - 用 集合 的 工厂 方法 setl) 
和 frozenset () : 








2^ s = set l cheeseshop’) 

2205 s 

BSetll 8. uS, Hu 0. Bü. BJ 
22^ t = frozenset ( bookshop’) 

222^ f 

frozenset(| b, °R, “ky °O, p. s 
22^ type(s) 

«type 'set'^ 

252 type (t) 

«type 'frozenset'» 

22» Ien(s) 

6 

2» len(s) == len(t) 





aa + 
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True 

D> s =t 

False 

如 何 访问 集合 中 的 值 











你 可 以 遍历 查看 集合 成 员 或 检查 茶 项 元 素 是 否 是 


2» Ck! ins 
False 

2> ° k int 
True 

2» ce not in t 
True 


225 for i in s: 


print i 

C 

e 

h 

O 
p 

S 

如 何 更 新 集合 





个 集合 中 的 成 员 : 


用 各 种 集合 内 建 的 方法 和 操作 符 添 加 和 删除 集合 的 成 员 : 


222 s.add(z’) 


2205 s 

set(['c’, "2. UA. “Os B. uw. x 

225» s. update ( pypi ) 

2205 s 

Set( B. "By “ty Bs S, Ha SL y,» X4 
2» s. remove Ĉ z’) 

2> s 

sa Gk qq dp teh, due ^n ocy!p 
2» s —= set(pypi ) 

2205 s 
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set (l c’, ‘a, *h’, 6", 2S7 7]) 





我 们 之 前 提 到 过 ， 只 有 可 变 集合 能 被 修改 。 试 图 修改 不 可 变 集合 会 引发 异常 。 





2» t.add(z’) 
Traceback (most recent call last): 
File “<stdin>”, line l, in ? 


AttributeError: 'frozenset' object has no attribute ’add’ 
如 何 删 除 集合 中 的 成 员 和 集合 
前 面 我 们 看 到 如 何 删除 集合 成 员 。 如 果 如 何 删除 集合 本 身 ， 可 以 像 删 除 任何 Python 对 象 一 样 ， 


令 集合 超出 它 的 作用 范围 , 或 调用 del 将 他 们 直接 清除 出 当前 的 名 字 空 间 。 如 果 它 的 引用 计数 为 零 ， 
也 会 被 标记 以 便 被 垃圾 回收 。 











>>> del s 
>>> 


. 7.7 集合 类 型 操作 符 E 


T. T. 1 标准 类 型 操作 符 《〈 所 有 的 集合 类 型 ) 


成 员 关 系 (n, not in) 
就 序列 而 言 ，Python 中 的 in Ml not in 操作 符 决 定 某 个 元 素 是 否 是 一 个 集合 中 的 成 员 。 








2» s = set( cheeseshop’) 
225» t = frozenset ( bookshop’) 
2k ins 

False 

ME int 

True 

2» 'c! not in t 

True 


集合 等 价 / 不 等 价 
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ee 


等 价 /不 等 价 被 用 于 在 相同 或 不 同 的 集合 之 间 做 比较 。 两 个 集合 相等 是 指 ， 对 每 个 集合 而 言 ， 当 
且 仪 当 其 中 一 个 集合 中 的 每 个 成 员 同 时 也 是 男 一 个 集合 中 的 成 员 。 

你 也 可 以 说 每 个 集合 必须 是 男 一 个 集合 的 一 个 子 集 ， 即 ，s 《<=t 和 so=t 的 值 均 为 真 (True)， 
或 (s <= t and ò= t) 的 值 为 真 (True) 。 集 合 等 价 /不 等 价 与 集合 的 类 型 或 集合 成 员 的 顺序 无 关 ， 

















只 与 集合 的 元 素 有 关 。 
2> s =t 
False 
> s It 
True 
22» u = frozenset (s) 
2 s == u 
True 
25» set( posh’) == set ( shop’) 
True 
子 集 / 超 集 





Sets 用 Python 的 比较 操作 符 检查 某 集合 是 否 是 其 他 集合 的 超 集 或 子 集 。 小 于 ”符号 (4 6 €) 
用 来 判断 子 集 ,“ 大 于 ”符号 4 > = ) 用 来 判断 超 集 。 





“小 于 ” 和 “大 于 ”意味 着 两 个 集合 在 比较 时 不 能 相等 。 等 于 号 允许 非 严格 定义 的 子 集 和 超 





集 。 


Sets 文 持 严格 (4 《 ) 子 集 和 非 严格 ( <=) TE, BRT > ) 超 集 和 非 严格 (>=) 
超 集 。 只 有 当 第 一 个 集合 是 第 二 个 集合 的 严格 子 集 时 ， 我 们 才 称 第 一 个 集合 “小 于 ”第 二 个 集合 ， 
同 理 ， 只 有 当 第 一 个 集合 是 第 二 个 集合 的 严格 超 集 时 ， 我 们 才 称 第 一 个 集合 “大 于 ”第 二 个 集合 。 


























2» setl shop’) < set ocheeseshop') 
True 

2> set ( bookshop’) >= set C shop’) 
True 


7.7.2 集合 类 型 操作 符 〈 所 有 的 集合 类 型 ) 


联合 ( | ) 

联合 (union) 操作 和 集合 的 OR PRAT HEAT HL (inclusive disjunction)) 其 实 是 等 价 的 ， 两 个 集 
合 的 联合 是 一 个 新 集合 ， 该 集合 中 的 每 个 元 素 都 至 少 是 其 中 一 个 集合 的 成 员 ， 即 ， 属 于 两 个 集合 其 
中 之 一 的 成 员 。 联 合 符号 有 一 个 等 价 的 方法 ，union (). 
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er 
* | * 


a at 
set ([’c’, p. e, "ph", *k’, 'o', UB 's' J) 





交集 ( & ) 
你 可 以 把 交集 操作 比 做 集合 的 AND (或 合 取 ) 操作。 两 个 集合 的 交集 是 一 个 新 集合 ,该 集合 中 的 每 
个 元 素 同 时 是 两 个 集合 中 的 成 员 ， 即 ， 属 于 两 个 集合 的 成 员 。 交 集 符号 有 一 个 等 价 的 方法 ， 


intersection(). 











2> s&t 
set([' B’, 3’, "a 7， 'p'] 


差 补 /相对 补 集 ( - ) 
两 个 集合 (s 和 t) 的 差 补 或 相对 补 集 是 指 一 个 集合 C， 该 集合 中 的 元 素 ， 只 属于 集合 s， 而 不 属 
于 集合 t。 差 符号 有 一 个 等 价 的 方法 ，difference0. 

















> s 次 
set (Le, 'e']) 





HRE) 

$ 和 其 他 的 布尔 集合 操作 相似 , 对 称 差 分 是 集合 的 XOR( 又 称 ” 异 或 ″ (exclusive disjunction) ). E 
两 个 集合 (s 和 t) 的 对 称 差 分 是 指 另外 一 个 集合 C 该 集合 中 的 元 素 ， 只 能 是 属于 集合 s 或 者 集合 t 
的 成 员 ， 不 能 同时 属于 两 个 集合 。 对 称 差 分 有 一 个 等 价 的 方法 ，symmetric_difference (). 




















CTI. 
set (Ck, B, 'e, “ef 


混合 集合 类 型 操作 


上 面 的 示例 中 ， 左 边 的 s 是 可 变 集合 ， 而 右边 的 t 是 一 个 不 可 变 集 合 . 注意 上 面 使 用 集合 操作 
运算 符 所 产生 的 仍然 是 可 变 集合 , 但 是 如 果 左 右 操作 数 的 顺序 反 过 来 ， 结 果 就 不 一 样 了 : 





UP X JE 

frozensef(l ce ° B, "e, hy Ek, 8, p, sJ) 
SU fS 

frozenset(['c', 'b', 'e', 'k' Jp 

2 t - s frozenset (l k’, 'b'f) 





如 果 左 右 两 个 操作 数 的 类 型 相同 ， 既 都 是 可 变 集合 或 不 可 变 集合 ， 则 所 产生 的 结果 类 型 是 相同 
的 ， 但 如 果 左 右 两 个 操作 数 的 类 型 不 相同 ( 左 操 作 数 是 set， 石 操作 数 是 frozenset， 或 相反 情况 ) ， 
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es. e i; 
1 i 


则 所 产生 的 结果 类 型 与 左 操作 数 的 类 型 相同 ， 上 例 中 可 以 证 明 这 一 点 。 还 要 注意 ， 加 号 不 是 集 
型 的 运算 符 : 























>vastt 
Traceback (most recent call last): 
File “stdin, line l, in ? 


TypeError: unsupported operand type(s) for +: ‘set’ and ‘set’ 


DOSS £ 

pee Y 

Sent, OG. B’, “@, BR, “Ky 8, D, $2 
2» len(v) 

8 

D> sr 

True 


7.7.3 集合 类 型 操作 符 〈 仅 适用 于 可 变 集 合 ) 


(Union) Update ( |» ) 
这 个 更 新 方法 从 已 存在 的 集合 中 添加 (可 能 多 个 ) 成 员 ， 此 方法 和 update O 等 价 . 








2 s = set l cheeseshop’) 

222 u = frozenset (s) 

2M» s /= setpypi') 

2205 s 

eT en dob dye Rok Go dup 


保留 /交集 更 新 ( &= ) 
保留 (或 交集 更 新 ) 操作 保留 与 其 他 集合 的 共有 成 员 。 此 方法 和 intersection update () 等 价 . 














2 s = set (u) 

222 s &= set( shop’) 

255 s 

set (lR, s, 0, p) 


差 更 新 ( -=) 
WEA s Fl t 进行 差 更 新 操作 s-=t， 差 更 新 操作 会 返回 一 个 集合 ， 该 集合 中 的 成 员 是 集合 s 去 
RERA t 中 元 素 后 剩余 的 元 素 。 此 方法 和 difference update O 等 价 . 

















$— 一 * 一 
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AM s = set (u) 

Do? s == set shop ) 
205 s 

set(l'c', 'e'[) 


对 称 差 分 更 新 ( = ) 
对 集合 s M t 进行 对 称 差 分 更 新 操作 (s =t), 对 称 差分 更 新 操作 会 返回 一 个 集合 ， 该 集合 中 的 成 
员 仅 是 原 集合 s 或 仅 是 另 一 集合 t 中 的 成 员 。 此 方法 和 symmetric difference update O 等 价 . 








2 s = set (Ww 

22» t = frozenset ( bookshop’) 
Ss St 

2205 s 

set(l'c, 'b', e, 'k' p 


7.8 内 建 函 数 


四 7. 8. 1 标准 类 型 函数 E 


len() 
把 集合 作为 参数 传递 给 内 建 函 数 len O , ， 返 回 集合 的 基数 (或 元 素 的 个 数 ) 。 





>>> s = set(u) 


>>> S 
set(l'p. ° e, "@ 3 “hs “sy. 0 ]) 
>>> len (s) 
6 
7. 8. 2 集合 类 型 工厂 函数 


set() and frozenset () 











set O 和 frozenset 0 工厂 函数 分 别 用 来 生成 可 变 和 不 可 变 的 集合 。 如 果 不 提供 任何 参数 ， 默 认 
会 生成 空 集合 。 如 果 提 供 一 个 参数 ， 则 该 参数 必须 是 可 壕 代 的 ， 即 ， 一 个 序列 ， 或 迭代 器 ， 或 支持 
TERA — POR, Dg: 一 个 文件 或 一 个 字典 。 

















$ 
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22» set) 
set ([ ]) 
222 set ([]) 
set ([ ]) 
2^ set(0) 
set ([ ]) 
225» set ( shop’) 
BRI AR, "- uw, np 
225 
22^ frozenset ([’ foo’, bar’ J) 
frozenset ([’ foo’, ° bar’ J) 
225 
2» f = open( numbers’, °w) 
2^ for i in range(5): 
f. write C “d\n? % i) 





aa» f. close 0 
2» f = open( numbers’, 'r') 
2> set (£) 


set (L Ola’, “Fla, "Ils, "di, "2m 7) 
22» f.close() 


7.9 集合 类 型 内 建 方法 


7.9. 1 方法 (所 有 的 集合 方法 ) 











我 们 已 看 到 很 多 和 内 建 方法 等 价 的 操作 符 ， 表 7.4 做 了 小 结 : 
内 建 方法 copy) 没有 等 价 的 操作 符 。 和 同名 的 字典 方法 一 样 ，copy 0 〇 方法 比 用 像 set O, 
frozenset O, zk dict (这样 的 工厂 方法 复制 对 象 的 副本 要 快 。 

















表 7.4 集合 类 型 方法 

方法 名 称 操作 

s. issubset (t) WR s Æt 的 子 集 ， 则 返回 True, 否则 返回 Fal se 
s. issuperset (t) WE t Æ s 的 超 集 ， 则 返回 True, 否则 返回 False 
s. union(t) 返回 一 个 新 集合 ， 该 集合 是 s 和 的 并 集 
s.intersection(t) 返回 一 个 新 集合 ， 访 集合 是 s Alt 的 交集 





$— 一 * 一 
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s. difference (t) 返回 一 个 新 集合 ， 该 集合 是 s 的 成 员 ， 但 不 是 t 的 成 员 

s. symmetric difference(t) 返回 一 个 新 集合 ， 该 集合 是 s kt 的 成 员 ， 但 不 是 s Mt 共有 的 
成 员 

s. copy O 返回 一 个 新 集合 ， 它 是 集合 s 的 浅 复制 











7. 9.2 方 法 〈 仅 适用 于 可 变 集合 ) 











表 7.5 总 结 了 所 有 可 变 集合 的 内 建 方 法 ， 和 上 面 的 方法 相似 ， 我 们 已 经 看 过 许多 和 它们 等 价 的 
操作 符 。 











新 的 方法 有 addO, removeO, discardO, popO, clearO. 这 些 接受 对 象 的 方法 ， 参 数 必 
须 是 可 哈 希 的 。 





7. 9. 3 操作 符 和 内 建 方法 比较 














像 你 看 到 的 ， 很 多 内 建 的 方法 几乎 和 操作 符 等 价 。 我 们 说 ”几乎 等 价 ”， 意 思 是 它们 间 是 有 一 个 
重要 区 别 :” 当 用 操作 符 时 ， 操 作 符 两 边 的 操作 数 必 须 是 集合 。 在 使 用 内 建 方 法 时 ， 对 象 也 可 以 是 
和 迭代 类 型 的 。 为 什么 要 用 这 种 方式 来 实现 呢 ? Python 的 文档 里 写 明 : KA DAY 

















set( abc').intersection( cbs’) 可 以 避免 用 setCabc ) [and] cb? 这 样 容 易 出 错 的 构建 方 


YK o 








表 7.5 可 变 集合 类 型 的 方法 














方法 名 操作 

s. update (t) 用 tt 中 的 元 素 修 改 s, BH, s 现在 包含 s 或 t 的 成 员 

s.intersection update(t) s 中 的 成 员 是 共同 属于 s Mt 的 元 素 。 

s. difference update (t) s 中 的 成 员 是 属于 s 但 不 包含 在 t 中 的 元 素 

s.symmetric difference update(t) s 中 的 成 员 更 新 为 那些 包含 在 s 或 4 中， 但 不 是 s 

Al t 共有 的 元 素 

s. add (obj) 在 集合 s 中 添加 对 象 obj 

s. remove (obj) 从 集合 s 中 删除 对 象 obj; WER obj 不 是 集合 s 中 的 元 素 (obj not 
in s)， 将 引发 KeyError 错误 

s. discard (obj) 如 果 obj 是 集合 s 中 的 元 素 ， 从 集合 s 中 删除 对 象 obj; 

s. pop () 删除 集合 s 中 的 任意 一 个 对 象 ， 并 返回 它 

s. clear () 删除 集合 s 中 的 所 有 元 素 





7.10 操作 符 、 函 数 /方法 














Edit By Vheavens 


Edit By Vheavens 


ee 
T 


集合 类 型 总 结 表 











表 7.6 中 ， 我 们 总 结 了 所 有 的 集合 类 型 的 操作 符 、 函 数 和 方法 
7.11 相关 模块 


集合 (set) 模 块 从 2.3 版 本 引进 , 可 继承 Set 或 ImmuteablSet 来 生成 子 类 。 虽 然 从 Python2. 4 
起 使 用 集合 类 型 ， 但 是 集合 模块 不 会 弃 用 。 





表 7.6 集合 类 型 操作 符 、 函 数 和 方法 
































函数 /方法 名 等 价 运算 符 说 明 
所 有 集合 类 型 
len(s) 集合 基数 : 集合 s 中 元 素 的 个 数 
set ([obj]) 可 变 集合 工厂 函数 ; obj 必须 是 支持 迭代 的 ， 由 obj 中 
的 元 素 创建 集合 ， 否 则 创建 一 个 空 集合 
frozenset ([obj]) 不 可 变 集 合 工 厂 函 数 ; 执行 方式 和 set 0 方法 相同 ， 
但 它 返 回 的 是 不 可 变 集 合 
obj in S 成 员 测试 : obj 是 s 中 的 一 个 元 素 吗 ? 
obj not in s 非 成 员 测 试 : obj 不 是 s 中 的 一 个 元 素 吗 ? 
s--t 等 价 测试 : 测试 s Al t 是 否 具 有 相同 的 元 素 ? 
s fe 不 等 价 测试 : 与 == 相 反 
st (严格 意义 上 ) 子 集 测 试 ; s != t 而且 s 中 所 有 
的 元 素 都 是 t 的 成 员 
s. issubset (t) s <=t 子 集 测试 (允许 不 严格 意义 上 的 子 集 ) : s 中 所 有 的 元 素 
都 是 t 的 成 员 
s>t (严格 意义 上 ) 超 集 测试 : s !=t MA t 中 所 有 的 元 素 
都 是 s 的 成 员 
s. issuperset (t) s >= t 超 集 测试 (允许 不 严格 意义 上 的 超 集 ) : t 中 所 有 的 元 素 
都 是 s 的 成 员 
s. union(t) - ME: 合并 操作 : s 或 t 中 的 元 素 
s.intersec- tion(t) s&t 交集 操作 : s At 中 的 元 素 
s. difference (t) s-t 差分 操作 : s 中 的 元 素 ， 而 不 是 t 中 的 元 素 
s. symmetric difference(t)s ° t 对 称 差分 操作 : s 或 t 中 的 元 素 ， 但 不 是 s Ft HA 
的 元 素 
s. copy O 复制 操作 :返回 s 的 ( 浅 复 制 ) 副本 





Table 7.6 集合 类 型 ， 函 数 和 方法 (继续 ) 
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函数 /方法 名 字 操作 符 等 价 描述 

仅 用 于 可 变 集合 

s. update (t) s |=t (Union) 修改 操作 : 将 t 中 的 成 员 添 加 s 

s. intersection update(t) s &- t 交集 修改 操作 : s 中 仪 包括 s 和 t 中 共有 的 成 员 

s.difference update(t) s -= t 差 修改 操作 : s 中 包括 仅 属 于 s THAN t 的 成 员 

s. symmetric 

difference 

update (t) g = 4% 对 称 差分 修改 操作 : s 中 包括 仅 属 于 s WEF t 的 

成 员 

s.add(obj) 加 操作 : 将 obj 添加 到 s 

s. remove (obj) 删除 操作 : 将 obj 从 s 中 删除 ， 如 果 s 中 不 存在 
obj, 将 引发 KeyError 

s. discard(obj) ERPE: remove() 的 友好 版 本 - 如 
R s 中 存在 obj, 
从 s 中 删除 它 

s. pop () Pop 操作 : 移 除 并 返回 s 中 的 任意 一 个 元 素 

s. clear () 清除 操作 : 移 除 s 中 的 所 有 元 素 





以 下 是 一 些 你 可 能 认为 有 用 的 在 线 参 考 文章 : 
http://en. wikipedia. org/wiki/Set http://www. geocities. com/basicmathsets/set. html 
http://www. math. uah. edu/stat/foundations/Sets. xhtml 


7.12 练习 








7-1. 字典 方法 。 哪 个 字典 方法 可 以 用 来 把 两 个 字典 合并 到 一 起 ? 

7-2. 字典 的 键 。 我 们 知道 字典 的 值 可 以 是 任意 的 Python 对 象 ， 那 字典 的 键 又 如 何 呢 ? THX 
着 将 除数 字 和 字符 串 以 外 的 其 他 不 同类 型 的 对 象 作 为 字典 的 键 ,看 一 看 ,哪些 类 型 可 以 ,哪些 不 行 ? 
对 那些 不 能 作 字 典 的 键 的 对 象 类 型 ， 你 认为 是 什么 原因 呢 ? 
































7-3. 字典 和 列表 的 方法 。 
(a) 创建 一 个 字典 ， 并 把 这 个 字典 中 的 键 按照 字母 顺序 显示 出 来 。 

(b) 现在 根据 已 按照 字母 顺序 排序 好 的 键 ， 显 示 出 这 个 字典 中 的 键 和 值 。 

(c) E (b) , 但 这 次 是 根据 已 按照 字母 顺序 排序 好 的 字典 的 值 ， 显 示 出 这 个 字典 中 的 键 和 值 。 GEE 
对 字典 和 哈 希 表 来 说 ， 这 样 做 一 般 没 有 什么 实际 意义 ， 因 为 大 多 数 访问 和 排序 (如 果 需 要 ) 都 是 
于 字典 的 键 ， 这 里 只 把 它 作 为 一 个 练习 。) 



































E a 








7-4. ”建立 字典 。 给 定 两 个 长 度 相 同 的 列表 ， 比 如 说 ， 列 表 [1，2，3,...] 和 [Dabc ， ”def ， 
”ghi”,... ], 用 这 两 个 列表 里 的 所 有 数据 组 成 一 个 字典 , 像 这 样 : {1: abc’, 2: def’, 3: ' ghi! ,...] 
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7-5. userpw2.py. PITA‘ fa) URP T. 1 中 管理 名 字 - 密 码 的 键 值 对 数据 的 程序 有 关 。 

(a) 修改 那个 脚本 ， 使 它 能 记录 用 户 上 次 的 登录 日 期 和 时 间 (用 time 模块 )， 并 与 用 户 密 码 一 起 
保存 起 来 。 程序 的 界面 有 要 求 用 户 输 入 用 户 名 和 密码 的 提示 。 无 论 户 名 是 否 成 功 登 录 ， 都 应 有 提示 ， 
在 户 名 成 功 登 录 后 ， 应 更 新 相应 用 户 的 上 次 登录 时 间 惟 。 如 果 本 次 登录 与 上 次 登录 在 时 间 上 相差 不 
超过 4 个 小 时 ， 则 通知 该 用 户 : “You already logged in at: «last login timestamp». ” 

(b) 添加 一 个 “管理 ”菜单 ， 其 中 有 以 下 两 项 : OD 删除 一 个 用 户 (2) 显示 系统 中 所 有 用 户 的 名 
字 和 他 们 的 密码 的 清单 。 

(c) 口令 目前 没有 加 密 , 请 添加 一 段 对 口令 加 密 的 代码 GES crypt, rotor， 或 其 它 加 密 模块 ) 

(d) 为 程序 添加 图 形 界面 ， 例 如 ， 用 Tkinter 写 。 

(e) 要 求 用 户 名 不 区 分 大 小 写 。 

(f) 加 强 对 用 户 名 的 限制 ， 不 允许 符号 和 空白 符 。 

(g) 合并 “新 用 户 ” 和 “ 老 用 户 ” 两 个 选项 。 如 果 一 个 新 用 户 试图 用 一 个 不 存在 的 用 户 名 登录 ， 
询问 该 用 户 是 否 是 新 用 户 ， 如 果 回 答 是 肯定 的 ， 就 创建 该 帐户 。 和 否则， 按照 老 用 户 的 方式 登录 。 







































































7-6. ”列表 和 字典 。 创 建 一 个 简单 的 股票 证 券 投 资 数 据 系统 。 其 中 应 至 少 包含 四 项 数据 : 股市 
行情 显示 器 符号 , 所 持 有 的 股票 , 购买 价格 及 当前 价位 - 你 可 以 随意 添加 其 他 数据 项 , 比如 收益 率 ， 
52 周 最 高 指数 、 最 低 指 数 ， 等 等 。 

用 户 每 次 输入 各 列 的 数据 构成 一 个 输出 行 。 每 行 数据 构成 一 个 列表 。 还 有 一 个 总 列表 ， 包 括 了 
所 有 行 的 数据 。 数 据 输 入 完毕 后 ， 提 示 用 户 选择 一 列 数据 项 进行 排序 。 把 该 数据 项 抽取 出 来 作为 字 
典 的 键 ， 字 典 的 值 就 是 该 键 对 应 行 的 值 的 列表 。 提 醒 读 者 : 被 选择 用 来 排序 的 数据 项 必须 是 非 重复 
Ne, 否则 就 会 丢失 数据 ， 因 为 字典 不 允许 一 个 键 有 多 个 值 。 

你 还 可 以 选择 其 他 计算 输出 ， 比 如 ， 熏 亏 比 率 ， 目 前 证 券 资产 价值 等 。 















































7-7. ”其 倒 字典 中 的 键 和 值 。 用 一 个 字典 做 输入 ， 输 出 另 一 个 字典 ， 用 前 者 的 键 做 值 ， 前 者 的 
值 做 键 。 




















7-8. 人力 资源 。 创 建 一 个 简单 的 雇员 姓名 和 编号 的 程序 。 让 用 户 输入 一 组 雇员 姓名 和 编号 。 
你 的 程序 可 以 提供 按照 姓名 排序 输出 的 功能 ， 雇 员 姓 名 显示 在 前 面 ， 后 面 是 对 应 的 雇员 编号 。 附 加 
题 : 添加 一 项 功能 ， 按 照 雇员 编号 的 顺序 输出 数据 。 




















7-9. ”翻译 

(a) 编写 一 个 字符 翻译 程序 (功能 类 似 于 Unix 中 的 tr 命令 ) 。 我 们 将 这 个 函数 叫做 trO, CA 
三 个 字符 串 做 参数 : 源 字符 串 、 目 的 字符 串 、 基 本 字符 串 ， 语 法 定义 如 下 : 

def tr(srcstr, dststr, string) 

srestr 的 内 容 是 你 打算 “翻译 ”的 字符 集合 ，dsrstr 是 翻译 后 得 到 的 字符 集合 ， 而 string 是 
你 打算 进行 翻译 操作 的 字符 串 。 举 例 来 说 ， 如 果 srcstr == abc’, dststr == 'mno', string == 
abcdef ， 那 么 tr (的 输出 将 是 -mnodef .注意 这 里 len (srcstr) == len(dststr). 

在 这 个 练习 里 ， 你 可 以 使 用 内 建 函 数 chr0 和 ord()， 但 它们 并 不 一 定 是 解决 这 个 问题 所 必 不 
可 少 的 函数 。 

(b) 在 这 个 函数 里 增加 一 个 标志 符 参 数 ， 来 处 理 不 区 分 大 小 写 的 翻译 问题 。 
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(c) 修改 你 的 程序 , 使 它 能 够 处 理 删 除 字 符 的 操作 。 字 符 串 srcstr PAN AEM HRY SIAC FFB dststr 
中 字符 的 多 余 字 符 都 将 被 过 滤 掉 。 换 句 话说 ， 这 些 字符 没有 了 映射 到 dststr 字符 串 中 的 任何 字符 ， 因 
此 就 从 函数 返回 的 字符 里 被 过 滤 掉 了 。 举 例 来 说 : 如 果 srcstr == 'abcdef', dststr == 'mno', 
string == 'abcdefghi', MA trO KME moghi . 注意 这 里 len (srcstr) >= len(dststr). 




















7-10. 加 密 。 

(a) 用 上 一 个 练习 的 思路 编写 一 个 “rot13 ”翻译 器 。 ”rot13 是 一 个 古老 而 又 简单 的 加 密 方法 ， 
它 把 字母 表 中 的 每 个 字母 用 其 后 的 第 13 个 字母 来 代替 。 字 母 表 中 前 半 部 分 字母 将 被 映射 到 后 半 部 分 ， 
而 后 半 部 分 字母 将 被 映射 到 前 半 部 分 ， 大 小 写 保持 不 变 。 举 例 来 说 ，"a 将 被 蔡 换 为 "mn ，X 将 被 蔡 
JR KR ; 数字 和 符号 不 进行 翻译 。 

(pb) 在 你 的 解决 方案 的 基础 上 加 一 个 应 用 程序 ， 让 它 提示 用 户 输入 准备 加 密 的 字符 串 (这 个 算法 
同时 也 可 以 对 加 密 后 的 字符 串 进 行 解密 ) ， 如 下 所 示 : 





























% rotl3. py 

Enter string to rot13: This is a short sentence. Your string to en/decrypt was: [This 
is a short sentence. /. 

The rotl3 string is: [Guvf vf n fubeg fragrapr. /. 

% 

% rotl3. py 

Enter string to rot13: Guvf vf n fubeg fragrapr. Your string to en/decrypt was: [Guvf 
vf n fubeg fragrapr. /. 


The rot13 string is: [This is a short sentence. J. 














7-11. 定义 。 什 么 组 成 字典 中 合法 的 键 ? 举例 说 明 字 典 中 合法 的 键 和 非法 的 键 。 








7-12. 定义 。 
(a) 在 数学 上 ， 什 么 是 集合 ? 
(b) Æ Python 中 ， 关 于 集合 类 型 的 定义 是 什么 ? 


7-13. 随机 数 。 修 改 练习 5-17 的 代码 : 使 用 random 模块 中 的 randint O 或 randrange O 77 
法 生成 一 个 随机 数 集合 : 从 0 到 9( 包 括 9) 中 随机 选择 ， 生 成 1 到 10 个 随机 数 。 这 些 数字 组 成 集合 
ACA 可 以 是 可 变 集 合 ， 也 可 以 不 是 ) 。 同 理 ， 按 此 方法 生成 集合 B。 每 次 新 生成 集合 A 和 B 后 ， 显 示 
结果 A|B 和 和 A&B 

















7-14. 用户 验证 。 修 改 前 面 的 练习 ， 要 求 用 户 输入 A | B 和 A&B 的 结果 ， 并 告诉 用 户 他 (或 
她 ) 的 答案 是 否 正确 ， 而 不 是 将 A | B 和 A&B 的 结果 直接 显示 出 来 。 如 果 用 户 回答 错误 ， 人 允许 他 (或 
她 ) 修改 解决 方案 ， 然 后 重新 验证 用 户 输入 的 答案 。 如 果 用 户 三 次 提交 的 答案 均 不 正确 ， 程 序 将 显示 
正确 结果 。 

附加 题 : 运用 你 关于 集合 的 知识 ， 创 建 菜 个 集合 的 潜在 子 集 ， 并 询问 用 户 此 潜在 子 集 是 否 真是 
该 集合 的 子 集 ， 要 求 和 主 程序 一 样 有 显示 更 正和 答案 的 功能 。 
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7-15. 编写 计算 器 。 这 个 练习 取材 于 http://math. hws. edu/ 在 线 免 费 Java 教材 中 的 练习 
12. 2。 编 写 一 个 程序 允许 用 户 选择 两 个 集合 :A 和 B， 及 运算 操作 符 。 例 如 ，in，not in, & |, ^, < 
€, >, 2», ==, l=, 56. 〈 你 自己 定义 集合 的 输入 语法 ， 它 们 并 不 一 定 要 像 Java 示例 中 那样 用 方 括 
号 括 住 。) 解 析 输 入 的 字符 串 ， 按 照 用 户 选择 的 运算 进行 操作 。 你 写 的 程序 代码 应 该 比 Java 版 本 的 
该 程序 更 简洁 。 
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T | 
条 件 和 循环 


F , A 





if 语句 

else 语句 

elif 语句 

条 件 表 达 式 

while 语句 

for 语句 

break 语句 

continue 语句 

pass 语句 

else 语句 (再 看 ) 

Iterators 迭代 器 

列表 解析 (List Comprehensions) 
生成 器 表达 式 (Generator Expressions ) 


H 
HH 
Ei 


e e o o o o o o o o o o o + 
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Chapter 








本 章 的 主要 内 容 是 Python 的 条 件 和 循环 语句 以 及 与 它们 相关 的 部 分 ， 我们 会 深入 探讨 if, 
while , for 以 及 与 他 们 相 搭 配 的 else, elif , break ，continue 和 pass 语句 . 


s 8.1 if 语句 


Python 中 的 if 子 句 看 起 来 十 分 熟悉 ， 它 由 三 部 分 组 成 : 关键 字 本 身 ， 用 于 判断 结果 真 假 的 
条 件 表 达 式 ， 以 及 当 表 达 式 为 真 或 者 非 零 时 执行 的 代码 块 . 
if 语句 的 语法 如 下 : 





























If expression: 
expr true suite 





if 语句 的 expr true suite 代码 块 只 有 在 条 件 表达 式 的 结果 的 布尔 值 为 真 时 才 执 行 ， 否 则 将 
继续 执行 紧 跟 在 该 代码 块 后 面 的 语句 . 


8.1.1 多 重 条 件 表达 式 


单个 if 语句 可 以 通过 使 用 布尔 操作 符 and, or 和 not 
实现 多 重 判断 条 件 或 是 否定 判断 条 件 . 


if not warn and (system load >= 10): 
print "WARNING: losing resources^ 


| 
4 
T 














Edit By Vheavens 


Edit By Vheavens 


ee 
T | T 


warn += 1 





8.1.2 单一 语句 的 代码 块 


如 果 一 个 复合 语句 (例如 if 子 句 ，while 或 for 循环 ) 的 代码 块 仅仅 包含 一 行 代码 ， 那 么 它 可 
以 和 前 面 的 语句 写 在 同一 行 上 : 


if make hard copy: send data to printer Q 














上 边 这 样 的 单行 语句 是 合法 的 ， 尽管 它 可 能 方便 ， 但 这 样 会 使 得 代码 更 难 阅读 ， 所 以 我 们 推 
荐 将 这 行 代码 移 到 下 一 行 并 合理 地 缩 进 ， 另 外 一 个 原因 就 是 如 果 你 需要 添加 新 的 代码 ， 你 还 是 得 把 
它 移 到 下 一 行 . 














8.2 else 语句 


和 其 他 语言 一 样 ，Python 提供 了 与 if 语句 搭配 使 用 的 else 语句 . 
A if 语句 的 条 件 表达 式 的 结果 布尔 值 为 假 ， 那 么 程序 将 执行 else 语句 后 的 代码 它 的 语 
法 你 甚至 可 以 猜 到 : 


if expression: 
expr true suite 


else: 














expr false suite 
这 里 是 样 例 代码 : 


if passwd == user. passwd: 
ret str = “password accepted” 
id = user. id valid = True 
else: 
ret str = “invalid password entered... try again!” 
valid = False 


8.2.1 We “BE else” 








Python 使 用 缩 进而 不 是 用 大 括号 标记 代码 块 边界 的 设计 ， 不 仅 帮 助 强 化 了 代码 的 正确 性 ， 而 

















且 还 上 暗中 帮助 程序 员 避 免 了 语法 上 正确 的 代码 中 存在 潜在 的 问题 ， 其 中 一 个 问题 就 是 (臭名 )〉 昭著 的 
“FEE else (dangling else)“ 问 题 ， 一 种 语义 错觉 . 


E 
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我 们 在 这 里 给 出 一 段 C 代码 来 说 明 我 们 的 例子 ( K&R 和 其 他 的 编程 教材 也 给 出 过 ) : 








/* dangling-else in C */ 
if (balance > 0. 00) 
if (((balance - amt) > min bal) && (atm cashout == 1)) 
printf( Here's your cash; please take all bills. |n); 
else 


printf(Your balance is zero or negative. |n); 


问题 是 : else 属于 哪个 if ? 在 C 语言 中 ， 规 则 是 else 与 最 近 的 if 搭配 ， 所 以 我 们 上 
面 的 例子 中 ，else 虽然 是 想 和 外 层 的 if 搭配 ， 但 是 事实 上 else 属于 内 部 的 if ,因为 C 编译 器 
会 忽略 额外 的 空白 . 结果， 如果 你 的 balance 是 正 数 但 小 于 最 小 值 ， 你 将 得 到 错误 的 输出 ， 程 序 
会 显示 你 的 balance 是 零 或 者 为 负数 . 








由 于 这 个 例子 很 简单 ， 所 以 解决 这 个 问题 并 不 难 ， 但 是 如 果 是 大 块 的 代码 租 入 到 了 类 似 这 样 
的 框架 中 ， 那 么 发 现 并 改正 程序 中 的 错误 需要 耗费 很 多 精力 . Python 设置 的 护栏 不 仅 阻止 你 掉 下 其 
崖 ， 而 且 会 带 你 离开 危险 的 境地 .在 Python 中 相同 的 例子 对 应 如 下 的 两 种 代码 (只 有 一 种 是 正确 
的 ) : 


























if balance > 0. 00: 
if balance - amt > min bal and atm cashout  : 
print “Here’s your cash; please take all bills. ^ 
else: 


print 'Your balance is zero or negative.” 
V EH. 
或 者 是 : 


if balance > 0. 00: 
if balance - amt > min bal and atm cashout  : 
print “Here’s your cash; please take all bills. ^ 
else: 


print 'Your balance is zero or negative.’ 


Python 的 缩 进 使 用 强制 使 代码 正确 对 齐 ， 让 程序 员 来 决定 else 属于 哪 一 个 if ， 限 制 您 的 先 
择 从 而 减少 了 不 确定 性 , Python 鼓励 您 第 一 次 就 写 出 正确 的 代码 ， 在 Python 中 制造 出 “悬挂 else" 
问题 是 不 可 能 的 ， 而 且 ， 由 于 大 括号 不 再 被 使 用 ，Python 代码 更 易 读 懂 
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8.3 elif (El else-if )i& 5] 








elif 是 Python HJ else-if 语句 ， 它 检查 多 个 表达 式 是 否 为 真 ， 并 在 为 真 时 执行 特定 代码 块 
中 的 代码 和 else 一 样 ，elif 声明 是 可 选 的 ， 然 而 不 同 的 是 ， 计 语句 后 最 多 只 能 有 一 个 else 
语句 ， 但 可 以 有 任意 数量 的 elif 语句 . 











if expressionl: 
expri true suite 

elif expression2: 
expr? true suite 


elif expressionN: 
exprN true suite 

else: 
none of the above suite 





switch/case 语句 的 替代 品 么 ? 


在 将 来 的 某 天 ，Python 可 能 会 支持 switch /case 语句 ， 但 是 你 完全 可 以 用 其 他 的 Python 


结构 来 模拟 它 ， 在 Python 中 ， 大 量 的 if-elif 语句 并 不 难 阅 读 : 


if user. cmd == 'create': 


action = “create item’ 


elif user. cmd == ‘delete’: 
action = 'delete item’ 


elif user. cmd == 'update': 
action = “update item’ 


else: 
action = “invalid choice... try again!’ 





上 面 的 语句 完全 可 以 满足 我 们 的 需要 ， 不 过 我 们 还 可 以 用 序列 和 成 员 关 系 操作 符 来 简化 它 : 


if user. cmd in ( create', 'delete', 'update'): 
action = °%s item’ % user. cmd 
else: 
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action = 'invalid choice... try again!’ 


另外 我 们 可 以 用 Python 字典 给 出 更 加 优雅 的 解决 方案 ， 我 们 将 在 第 七 章 “ 映 射 和 集合 类 型 “ 
中 介绍 字典 . 


msgs = { create’: 'create item’, 
‘delete’: ‘delete item’, 
'update': “update item’ / 
default = 'invalid choice... try again!’ 
action = msgs. get (user. cmd, default) 


众所周知 ， 使 用 映射 对 象 (比如 字典 ) 的 一 个 最 大 好 处 就 是 它 的 搜索 操作 比 类 似 if-elif-else 
语句 或 是 for 循环 这 样 的 序列 查询 要 快 很 多 . 








=>- 


8.4 条件 表达 式 ( 即 “三 元 操作 符 ”) 


如 果 你 来 自 C/C++ 或 者 是 Java 世界 ， 那 么 你 很 难 忽略 的 一 个 事实 就 是 Python 在 很 长 的 一 
段 时 间 里 没有 条 件 表达 式 (C ? X: Y)， 或 称 三 元 运算 符 . CC 是 条 件 表达 式 ; X 是 C True 时 
KWER, Y 是 C 为 False 时 的 结果 ) 贵 铎 。 范 。 罗 萨 姆 一 直 拒绝 加 入 这 样 的 功能 ， 因 为 他 认为 应 

$ 该 保持 代码 简单 ， 让 程序 员 不 轻易 出 错 . 不 过 在 十 年 多 后 ， 他 放弃 了 ， 主 要 是 因为 人 们 试 着 用 E 























and 和 or 来 模拟 它 ， 但 大 多 都 是 错误 的 ， 根 据 FAQ ， 正 确 的 方法 (并 不 唯一 ) 是 
(C and [X] or [Y]) L0] .唯一 的 问题 是 社区 不 同意 这 样 的 语法 . (你 可 以 看 一 看 PEP 308， 其 
中 有 不 同 的 方案 .) 对 于 Python 的 这 一 问题 ， 人 们 表达 了 极 大 的 诉求 . 














贵 铎 。 范 。 罗 萨 姆 最 终 选 择 了 一 个 最 被 看 好 (也 是 他 最 喜欢 ) 的 方案 ， 然 后 把 它 运 用 于 标准 库 中 
的 一 些 模块 .根据 PEP ,，“ 这 个 评审 通过 考察 大 量 现实 世界 的 案例 ， 包 含 不 同 的 应 用 ， 以 及 由 不 同 
程序 员 完 成 的 代码 . ”最 后 Python 2.5 集成 的 语法 确定 为 : X if C else Y. 















































有 了 三 元 运算 符 后 你 就 只 需要 一 行 完 成 条 件 判 断 和 赋值 操作 ， 而 不 需要 像 下 面 例子 中 的 minO 
那样 ， 使 用 if-else 语句 实现 对 数字 x 和 y 的 操作 : 


2x y=4 3 
2 If X Sy: 
smaller = x 
. else: 
smaller = y 


225 smaller 
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在 2.5 以 前 的 版 本 中 ，Python 程序 员 最 多 这 样 做 (其 实 是 一 个 hack ) : 


g 


2» smaller = (x < y and [x] or [y]) [0] 
225 smaller 
2 


在 2.5 和 更 新 的 版 本 中 ， 你 可 以 使 用 更 简明 的 条 件 表达 式 : 
222 smaller = x if x < y else y 


225^ smaller 
3 


8.5 while 语句 





Python HJ while 是 本 章 我 们 遇 到 的 第 一 个 循环 语句 ， 事 实 它 上 是 一 个 条 件 循环 语句 .与 if 
声明 相 比 ， 如 果 if 后 的 条 件 为 真 ， 就 会 执行 一 次 相应 的 代码 块 . 而 while 中 的 代码 块 会 一 直 循 
环 执行 ， 直 到 循环 条 件 不 再 为 真 . 


8. 5. 1 一 般 语 法 E 
while 循环 的 语法 如 下 : 


while expression: 





suite to repeat 


while 循环 的 suite to repeat 子 句 会 一 直 循 环 执行 ， 直 到 expression 值 为 布尔 假 . 这 种 
类 型 的 循环 机 制 营 稼 用 在 计数 循环 中 ， 请 参见 下 节 中 例子 . 











8. 5. 2 计数 循环 


count = 0 

while (count < 9): 
print 'the index is:’, count 
count += 1 








这 里 的 代码 块 里 包含 了 print 和 自 增 语句 ， 它 们 被 重复 执行 ， 直 到 count 不 再 小 于 9. RII 
count 在 每 次 迭代 时 被 打印 出 来 然后 自 增 1 . 在 Python 解释 器 中 输入 这 些 代 码 我 们 将 得 到 这 样 的 
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222 count = 0 

2» while (count < 9): 
print 'the index is:', count 
count += 1 


the index Is: 
the index is: 
the index is: 
the index is: 
the index is: 
the index is: 
the index is: 
the index is: 


99 ^4 Q& & A & l5 « DD 


the index is: 


8. 5. 3 无 限 循环 


你 必须 小 心地 使 用 while 循环 ， 因 为 有 可 能 condition 永远 不 会 为 布尔 假 . 这 样 一 来 循环 
就 永远 不 会 结束 . 这些“ 无 限 ” 的 循环 不 一 定 是 坏事 ， 许 多 通讯 服务 器 的 客户 端 / 服 务 器 系统 就 是 通 
过 它 来 工作 的 . 这 取决 于 循环 是 否 需 要 一 直 执 行 下 去 ， 如 果 不 是 ， 那 么 这 个 循环 是 否 会 结束 ; Tht 
是 说 ， 条 件 表达 式 会 不 会 计算 后 得 到 布尔 假 ? 























while True: 
handle, indata = wait for client connect () 
outdata = process request (indata) 
ack result to client(handle, outdata) 





例如 上 边 的 代码 就 是 故意 被 设置 为 无 限 循环 的 ， 因 为 True 无 论 如 何 都 不 会 变 成 False， 这 和 是 因 
为 服务 器 代码 是 用 来 等 竺 客户 端 (可 能 通过 网 络 ) 来 连接 的 ， 这 些 客 户 端 向 服务 器 发 送 请 求 ， 服 务 器 
处 理 请 求 . 














请 求 被 处 理 后 ， 服 务 器 将 向 客户 端 返回 数据 ， 而 此 时 客户 端 可 能 断 开 连 接 或 是 发 送 男 一 个 请 求 
对 于 服务 器 而 言 它 已 经 完成 了 对 这 个 客户 端的 任务 ， 它 会 返回 最 外 层 循环 等 待 下 一 个 连接 .在 第 
16 x, “网 络 编程 ”和 第 17 章节 “Internet 客户 端 编程 ”里 你 将 了 解 关 于 如 何 处 理 客 户 端 / 服 务 
器 的 更 多 信息 . 

















$— 一 * 一 
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8.6 for 语句 


Python 提供 给 我 们 的 另 一 个 循环 机 制 就 是 for 语句 ， 它 提供 了 Python 中 最 强大 的 循环 结构 . 
它 可 以 遍历 序列 成 员 ， 可 以 用 在 列表 解析 和 生成 器 表达 式 中 ， 它 会 自动 地 调用 运 代 器 的 next () 
方法 ， 捕 获 StopIteration 异常 并 结束 循环 (所 有 这 一 切 都 是 在 内 部 发 生 的 )， 如 果 你 刚刚 接触 
Python 那么 我 们 要 告诉 你 ， 在 以 后 你 会 经 常用 到 它 的 . 和 传统 语言 (例如 C/C++ ，Fortran， 或 者 
Java ) 中 的 for 语句 不 同 ，Python 的 for 更 像 是 shell 或 是 脚本 语言 中 的 foreach 循环 . 
































8. 6. 1 一般 语法 











for 循环 会 访问 一 个 可 和 迭代 对 象 ( 例 如 序列 或 是 迭代 器 ) 中 的 所 有 元 素 ， 并 在 所 有 条 目 都 处 理 过 
后 结束 循环 . 它 的 语法 如 下 : 











for iter var in iterable: 


suite to repeat 


每 次 循环 ，iter_var 迭代 变量 被 设置 为 可 迭代 对 象 (序列 ， 和 迭代 器 ， 或 者 是 其 他 支持 迭代 的 对 
象 ) 的 当前 元 素 ， 提 供给 suite to repeat 语句 块 使 用 . 


$ 8. 6. 2 用 于 序列 类 型 E 


本 节 中 ， 我 们 将 学 习 用 for FMEA IITA. Pb PR, IR, UATH. 














>» for eachLetter in 'Names': 


print 'current letter:’, eachLetter 


current letter: 
current letter: 


N 
a 
current letter: m 
current letter: e 

S 


current letter: 




















RCE TERI, BAURELR Ea -DEERE 1 MFR). (ELAR ACIS. EFRR 
里 中 查找 字符 时 ， 程 序 员 往往 使 用 in 来 测试 成 员 关系 ， 或 者 使 用 string 模块 中 的 函数 以 及 字符 
PIERRAT ERR. 














看 到 单个 的 字符 在 一 种 情况 下 有 用 , 即 在 通过 print 语句 调试 for 循环 中 的 序列 时 ， 如 果 你 在 
应 该 看 到 字符 串 的 地 方 发 现 的 却 是 单个 的 字符 ， 那 么 很 有 可 能 你 接受 到 的 是 一 个 字符 串 ， 而 不 是 对 
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象 的 序列 . 
迭代 序列 有 三 种 基本 方法 : 














通过 序列 项 迭代 
> nameList = [ Walter’, “Nicole”, 'Steven', 'Henry'/ 
222 for eachName in nameList: 


^ 


print eachName, “Lim 


Walter Lim 
Nicole Lim 
Steven Lim 
Henry Lim 





FEET BIF HH, BOGEN TI. BEVIN, eacgName 变量 都 被 设置 为 列表 中 特定 某 个 元 





然后 我 们 在 代码 块 中 打印 出 这 个 变量 . 


--= 通 过 序列 索引 迭代 =-- 





另 个 方法 就 是 通过 序列 的 索引 来 迭代 : 


2» nameList = [’Cathy’, “Terry”, 'Joe', 'Heather', 
"Lucy" / 
>»» for nameIndex in range (len (nameList)): 

print “Liu, ^ nameList[nameIndex/ 


Liu, Cathy 
Liu, Terry 
Liu, Joe 

Liu, Heather 
Liu, Lucy 








我 们 没有 和 迭代 元 素 ， 而 是 通过 列表 的 索引 迭代 . 





这 里 我 们 使 用 了 内 建 的 len() 函数 获得 序列 长 度 ， 使 用 rangeO 函数 (我 们 将 在 下 面 详 细 讨 
论 它 ) 创建 了 要 迭代 的 序列 ， 








25» len (nameList) 
5 
2^» range (len (nameList)) 


$— 一 * 一 














Edit By Vheavens 


Edit By Vheavens 


ee 
T 


/0, L 2 3,4 





使 用 rangeO 我 们 可 以 得 到 用 来 迭代 nameList 的 索引 数列 表 ; 使 用 切片 /下 标 操作 符 ([ ] )， 
就 可 以 访问 对 应 的 序列 对 象 . 


如 果 你 对 性 能 有 所 了 解 的 话 ， 那 么 蝇 无 疑问 你 会 意识 到 
直接 迭代 序列 要 比 通过 索引 进 代 快 . 如 果 你 不 明白 ， 那 么 你 可 以 仔细 想 想 . 
(参见 练习 8-13). 








=== 使 用 项 和 索引 进 代 === 











两 全 其 美的 办 法 是 使 用 内 建 的 enumerate() 函数 ， 它 是 Python 2.3 的 新 增 内 容 ， 代 码 如 下 : 


2» nameList = [’Donn’, 'Shirley', 'Ben', ’ Janice’, 
'David', 'Yen', ° Wendy’ J 

22^ for i, eachLee in enumerate (nameList): 
print “4d %s Lee” % (itl, eachLee) 


1 Donn Lee 

2 Shirley Lee E 
3 Ben Lee 

4 Janice Lee 
5 David Lee 


6 Yen Lee 
/ Wendy Lee 


8.603 ”用 于 迭代 器 类 型 





用 for 循环 访问 和 迭代 器 和 访问 序列 的 方法 差不多 ， 唯一 的 区 别 就 是 for 语句 会 为 你 做 一 些 额 
外 的 事情 ， 和 从 代 器 并 不 代表 循环 条 目的 集合 . 








ERA RAT next) 方法 ， 调 用 后 返回 下 一 个 条 目 . MAAR EIR, Ra Sl R 
个 StopIteration 异常 告诉 程序 循环 结束 . for 语句 在 内 部 调用 nextO 并 捕获 异常 . 




















使 用 和 迭代 器 做 for 循环 的 代码 与 使 用 序列 条 目 几 乎 完全 相同 . 事实 上 在 大 多 情况 下 ， 你 无 法 
分 辨 出 你 兴 代 的 是 一 个 序列 还 是 迭代 器 ， 因 此 ， 这 就 是 为 什么 我 们 在 说 要 遍历 一 个 迭代 嚣 时， 实际 
LAY RESTS We BoP, Ea, BE PSEA CEA next 0 77120. 
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8.6.4 range) 内 建 函 数 





我 们 前 面 介绍 Python 的 for 循环 的 时 候 提 到 过 它 是 一 种 迭代 的 循环 机 制 ，Python 同样 提供 
一 个 工具 让 我 们 在 传统 的 伪 条 件 设置 下 使 用 for 声明 ， 例 如 从 一 个 数字 开始 计数 到 另外 个 数字 ， 
旦 到 达 最 后 的 数字 或 者 某 个 条 件 不 再 满足 就 立刻 退出 循环 . 











内 建 函 数 rangeO 可 以 把 类 似 foreach 的 for 循环 变 成 你 更 加 熟悉 的 语句 ， 例 如 从 0 到 
10 计数 ， 或 者 从 10 到 100 一 次 递增 5 . 





=== range() 的 完整 语法 === 























Python 提供 了 两 种 不 同 的 方法 来 调用 rane) . 完整 语法 要 求 提 供 两 个 或 三 个 整数 参数 : 


range(start, end, step =1) 
range) 会 返回 一 个 包含 所 有 k 的 列表 ， 这 里 start <= k € end, M start 到 end, k 








递增 step. step 不 可 以 为 零 , 否则 将 发 生 错 误 . 


2» range(2, 19, 3) 


I2 5 & 1L 14 17] 
如 果 只 给 定 两 个 参数 ， 而 省 略 step, step 就 使 用 默认 值 1 . 


2» range(3, 7) 
[3, 4 5 6] 








我 们 来 看 看 解释 器 环境 下 的 例子 


222 for eachVal in range(2, 19, 3): 
print “value is:^, eachVal 


value is: 2 
value is: 5 
value is: 8 
value is: 11 
value is: 14 
value is: 17 





我 们 的 循环 从 2“ 数 ”到 19 ， 每 次 递增 3 .如 果 你 对 C 熟悉 的 话 ， 你 会 发 现 ，range 0 的 参 
数 与 C 的 for 循环 变量 有 着 直接 的 关系 : 
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/* equivalent loop in C */ 
for (eachVal = 2; eachVal < 19; eachVal += 3) { 
printf( value is: %d\n*, eachVal); 





/ 








虽然 看 起 来 像 是 一 个 条 件 循 环 (检查 eachVal< 19 )， 但 实际 上 是 rangeO 先 用 我 们 指定 的 条 
件 生成 一 个 列表 ， 然 后 把 列表 用 于 这 个 for 语句 . 


===range() 简略 语法 === 





range() 还 有 两 种 简略 的 语法 格式 : 





range (end) 


range (start, end) 











我 们 在 第 2 章 看 到 过 最 短 的 语法 接受 一 个 值 ，start 默认 为 0 step 默认 为 1 ， 然 后 
range (返回 从 0 到 end 的 数列 . 


2> range (5) 
/0, 1, 2, 3, 4 


range) 的 中 型 版 本 和 完整 版 本 几乎 完全 一 样 ， 只 是 step 使 用 默认 值 1. 现在 我 们 在 
Python 解释 器 中 试 下 这 条 语句 : 








22^ for count in range(2, 5): 


print count 


2 
了 
4 


核心 笔记 : 为 什么 range) 不 是 只 有 一 种 语法 ? 

你 已 经 知道 了 rane) 的 所 有 语法 ， 有 些 人 可 能 会 问 一 个 挑剔 的 问题 ， 为 什么 不 把 这 两 种 语 
法 合并 成 一 个 下 面 这 样 的 语法 ? 

range(start-0, end, step -1) # 错误 

这 个 语法 不 可 以 使 用 两 个 参数 调用 . 因为 step BRA start . 换 句 话说 ， 你 不 能 只 传递 
end 和 step 参数 . 因为 它们 会 被 解释 器 误 认为 是 start 和 end. 
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8.6.5 xrange() 内 建 函 数 





xrange() 类 似 range) ， 不 过 当 你 有 一 个 很 大 的 范围 列表 时 ，xrange() 可 能 更 为 适合 ， 因 为 
它 不 会 在 内 存 里 创建 列表 的 完整 拷贝 . 它 只 被 用 在 for 循环 中 ， 在 for 循环 外 使 用 它 没 有 意义 。 
同样 地 ， 你 可 以 想到 ， 它 的 性 能 远 高 出 range ()， 因 为 它 不 生成 整个 列表 。 在 Python 的 将 来 版 本 
H, range) 可 能 会 像 xrangeO 一 样 ， 返 回 一 个 可 迭代 对 象 (不 是 列表 也 不 是 一 个 迭代 器 ) - ES 
像 前 边 一 章 讨论 的 那样 . 

















8. 6. 6 与 序列 相关 的 内 建 函 数 


sorted(), reversed(), enumerate(), zip() 

FLA fii FH S PATH AP A PR I. AM Ae ^ PS WE? 是 因为 其 中 两 个 函 
数 ( sortedO 和 zipO ) 返 回 一 个 序列 (列表 )， 而 另外 两 个 函数 ( reversed O 和 enumerateO ) 
返回 迭代 器 (类 似 序列 ) 





2» albums = ( Poe’, 'Gaudi', 'Freud', 'PoeZ2') 
22» years = (1976, 1987, 1990, 2003) 


>» for album in sorted(albums) : 
DE print album, 

Freud Gaudi Poe Poe? 

225 


> for album in reversed(albums): 


print album, 


Poe2 Freud Gaudi Poe 

225 

22^ for i, album in enumerate (albums) : 
print i, album 

0 Poe 

1 Gaudi 

2 Freud 

3 Poe2 

225 

2^ for album, yr in zip(albums, years): 
print yr, album 
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1976 Poe i 
1987 Gaudi 


1990 Freud 
2003 Poe2 


我 们 已 经 涵盖 了 Python 中 的 所 有 循环 语句 ， 下 面 我 们 看 看 循环 相关 的 语句 ， 包 括 用 于 放弃 循 
环 的 break 语句 ， 和 立即 开始 下 一 次 迭代 的 continue 语句 . 


8.7 break 语句 





Python 中 的 break 语句 可 以 结束 当前 循环 然后 跳 转 到 下 条 语句 ， 类 似 C 中 的 传统 break . 
常用 在 当 某 个 外 部 条 件 被 触发 (一 般 通 过 if 语句 检查 )， 需 要 立即 从 循环 中 退出 时 ，break 语句 可 
以 用 在 while 和 for 循环 中 . 





count = num / 2 
while count > 0: 


if num % count == 0: 
print count, 'is the largest factor of', num 
break 

count — 7 





上 边 这 段 代 码 用 于 寻找 给 定数 字 num 的 最 大 约 数 .我 们 迭代 所 有 可 能 的 约 数 ，count 变量 依次 
递减 ， 第 一 个 能 整除 num 的 就 是 我 们 要 找 的 最 大 约 数 ， 找 到 后 就 不 再 再 继续 找 了 ， 使 用 break if 
句 退 出 循环 . 














phoneZremove = '555-1212' 
for eachPhone in phonelist: 
if eachPhone == phoneZremove: 
print “found”, phoneZremove, '... deleting’ 
deleteFromPhoneDB (phoneZremove) 
break 


这 里 的 break TE &JHIT HT MIRER. 目的 是 为 了 找到 列表 中 的 目标 元 素 ， 如 果 找 到 ， 则 
把 它 从 数据 库 里 删除 然后 退出 循环 . 


8. 8 continue 语句 


核心 笔记 : continue 语句 


E 











$— 一 * 一 
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ee 
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AN Python, C, Java 还 是 其 它 任 何 支 持 continue 语句 的 结构 化 语言 中 ， 一 些 初学 者 有 这 样 
的 一 个 误解 :continue 语句 “立即 启动 循环 的 下 一 次 迭代 .实际 上 ， 当 遇 到 continue 语句 时 ， 程 
序 会 终止 当前 循环 , 并 忽略 剩余 的 语句 ， 然 后 回 到 循环 的 顶端 ， 在 开始 下 一 次 迭代 前 , 如 果 是 条 件 循 
环 ， 我 们 将 验证 条 件 表达 式 . 如 果 是 迭代 循环 , 我 们 将 验证 是 否 还 有 元 素 可 以 迭代 . 只 有 在 验证 成 功 
的 情况 下 ， 我 们 才 会 开始 下 一 次 迭代 . 





Python E continue 语句 和 其 他 高 级 语言 中 的 传统 continue 并 没有 什么 不 同 ， 它 可 以 被 
用 在 while 和 for 循环 里 . while 循环 是 条 件 性 的 ， 而 for 循环 是 近代 的 ， 所 以 continue 在 开 
台 下 一 次 循环 前 要 满足 一 些 先 决 条 件 (前 边 的 核心 笔记 中 强调 的 )， 否 则 循环 会 正常 结束 . 














valid = False 

count = 3 

while count > 0: 
input = raw_input (“enter password’) 
# check for valid passwd 
for eachPasswd in passwdList: 


if input == eachPasswd: 
valid = True 
break 
if not valid: # (or valid == 0) 
print “invalid input’ 
count — 1 
continue 
else: 
break 





这 里 例子 结合 使 用 了 while , for, if, break 以 及 continue ， 用 来 验证 用 户 输入 ， 用 
户 有 三 次 机 会 来 输入 正确 的 密码 ， 如 果 失 败 ， 那 么 valid 变量 将 仍 为 一 个 布尔 假 ( 0 )， 然 后 我 们 
可 以 采取 必要 的 操作 阻止 用 户 猜测 密码 . 


























8.9 pass 语句 


Python 还 提供 了 pass 语句 ( C 中 没有 提供 对 应 的 语句 ). Python 没有 使 用 传统 的 大 括号 来 标 
记 代 码 块 ， 有 时 , 有 些 地 方 在 语法 上 要 求 要 有 代码 ， 而 Python 中 没有 对 应 的 空 大 括号 或 是 分 号 (; ) 
来 表示 C 语言 中 的 “不 做 任何 事 ”， 如 果 你 在 需要 子 语句 块 的 地 方 不 写 任何 语句 ， 解 释 器 会 提示 你 
语法 错误 . 因此 ，Python 提供 了 pass 语句 ， 它 不 做 任何 事情 - 即 NOP, ( No OPeration , Æ 
操作 ) 我 们 从 汇编 语言 中 借用 这 个 概念 . pass 同样 也 可 作为 开发 中 的 小 技巧 ， 标 记 你 后 来 要 完成 的 
代码 ， 例 如 这 样 : 
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def foo func Q: 


pass 





或 是 


if user choice == ao calc’: 
pass else: 
pass 




















这 样 的 代码 结构 在 开发 和 调试 时 很 有 用 ， 因 为 编写 代码 的 时 候 你 可 能 要 先 把 结构 定 下 来 ， 但 你 
不 希望 它 干扰 其 他 已 经 完成 的 代码 ， 在 不 需要 它 做 任何 事情 地 方 ， 放 一 个 pass 将 是 一 个 很 好 的 主 











男 外 它 在 异常 处 理 中 也 被 经 常用 到 ， 我 们 将 在 第 10 章 中 详细 介绍 ;比如 你 跟踪 到 了 一 个 非 致 
命 的 错误 ， 不 想 采取 任何 措施 (你 只 是 想 记 录 一 下 事件 或 是 在 内 部 进行 处 理 ). 























8.10 Bik else 语句 


在 C (以 及 大 多 其 他 语言 中 )， 你 不 会 在 条 件 语 句 范 围 外 发 现 else 语句 ， 但 Python 不 同 ， 
你 可 以 在 while 和 for 循环 中 使 用 else 语句 .它们 是 怎么 工作 的 呢 ? 在 循环 中 使 用 时 ，else 
子 句 只 在 循环 完成 后 执行 ， 也 就 是 说 break 语句 也 会 跳 过 else W. 

















展示 while 语句 中 else 用 法 的 一 个 例子 就 是 寻找 一 个 数 的 最 大 约 数 .我 们 已 经 实现 了 完成 
这 个 任务 的 函数 ， 使 用 while 循环 和 else 语句 . Example 8.1  (maxFact.py) 利用 这 个 语法 完成 
了 showMaxFactor() 函数 . 


Example 8.1 while-else Loop Example (maxFact. py) 
这 个 程序 显示 出 10 到 20 中 的 数字 的 最 大 约 数 .该 脚本 也 会 提示 这 个 数 是 否 为 素数 . 


7 #l/usr/bin/env python 
2 
3 def showMaxFactor (num) : 
4 count - num / 2 
5 while count > I: 
6 if num % count == 0: 
7 print 'largest factor of %d is %d’ % | 
8 (num, count) 
9 break 
10 count — 1 
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77 else: 

12 print num, “is prime^ 

13 

14 for eachNum in range(10, 21): 
15 showllaxFactor (eachNum) 





showMaxFactor () 函数 中 第 3 行 的 循环 从 amount 的 一 半 开 始 计数 (这 样 就 可 以 检查 这 个 数 是 否 
可 以 被 2 整除 ， 如 果 可 以 ， 那 就 找到 了 最 大 的 约 数 )， 然 后 循环 每 次 递减 1 (第 10 行 )， 直 到 发 现 
约 数 (第 6-9 行 )， 如 果 循环 递减 到 1 还 没有 找到 约 数 ， 那 么 这 个 数 一 定 是 素数 ，11-12 行 的 else 
子 句 负责 处 理 这 样 的 情况 ， 程 序 的 主体 ( 14-15 行 ) 用 数字 参数 调用 showllaxFactor () . 

执行 该 程序 将 得 到 这 样 的 输出 : 








largest factor of 10 is 5 
ll is prime 
largest factor of 12 is 6 
13 is prime 

largest factor of 14 is 7 
largest factor of 15 is 5 
largest factor of 16 is 8 
I7 is prime 

largest factor of 18 is 9 
19 is prime 

largest factor of 20 is 10 


同样 地 ，for 循环 也 可 以 有 else 用 于 循环 后 处 理 (post-processing). 它 和 while 循环 中 的 
else 处 理 方 式 相同 ， 只 要 for 循环 是 正常 结束 的 (不 是 通过 break ), else 子 句 就 会 执行 .我 们 在 
8.5.3 已 经 见 过 这 样 的 例子 

表 8.1 条 件 及 循环 语句 中 的 辅助 语句 总 结 


Loops and Conditionals 














Auxiliary Statements if while for 
elif H 

else H . . 
break . . 
continue . . 
pass’ EH . e 








a. pass 在 任何 需要 语句 块 ( 一 个 或 多 个 语句 ) 的 地 方 都 可 以 使 用 (例如 elif, else, clasa, 


e 
| 
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def , try , except , finally ). 





8.11 REM iter) 函数 


8.11.1 什么 是 迭代 器 ? 

和 迭代 器 是 在 版 本 2.2 被 加 入 Python 的 ， 它 为 类 序列 对 象 提供 了 一 个 类 序列 的 接口 ， 我 们 在 
前 边 的 第 6 童 已 经 正式 地 介绍 过 序列 ， 它 们 是 一 组 数据 结构 ， 你 可 以 利用 它们 的 索引 从 0 开始 一 直 
“和 迭代 ”到 序列 的 最 后 一 个 条 目 ， 用 ?计数 “的 方法 迭代 序列 是 很 简单 的 ，Python 的 迭代 无 颖 地 支持 
序列 对 象 ， 而 且 它 还 允许 程序 员 和 迭代 非 序列 类 型 ， 包 括 用 户 定义 的 对 象 . 




















迭代 器 用 起 来 很 灵巧 ， 你 可 以 迭代 不 是 序列 但 表现 出 序列 行为 的 对 象 ， 例 如 字典 的 key ， 一 个 
文件 的 行 ， 等 等 ， 当 你 使 用 循环 迭代 一 个 对 象 条 目 时 ， 你 几乎 不 可 能 分 辨 出 它 是 迭代 器 还 是 序列 . 
你 不 必 去 关注 这 些 ， 因 为 Python 让 它 象 一 个 序列 那样 操作 . 





8.11. 2 为 什么 要 迭代 器 ? 


援引 PEP (234) 中 对 迭代 器 的 定义 : E 


提供 了 可 扩展 的 迭代 器 接口 . 

对 列表 迭 代 带 来 了 性 能 上 的 增强 . 
FEF BL RAN P TERETEZT. 

创建 真正 的 迭代 接口 ， 而 不 是 原来 的 随机 对 象 访问 . 

与 所 有 已 经 存在 的 用 户 定义 的 类 以 及 扩展 的 模拟 序列 和 映射 的 对 象 向 后 漠 
迭代 非 序列 集合 (例如 映射 和 文件 ) 时 ， 可 以 创建 更 简洁 可 读 的 代码 . 























:: 














8. 11. 3 如 何 迭 代 ? 


BAS Lit, VERA EA TS next) 方法 的 对 象 ， 而 不 是 通过 索引 来 计数 . 当 你 或 是 一 个 循 
环 机 制 ( 例 如 for 语句 ) 需要 下 一 个 项 时 ， 调 用 迭代 器 的 next () 方法 就 可 以 获得 它 . 条 目 全 部 取 
出 后 ， 会 引发 一 个 StopIteration 异常 ， 这 并 不 表示 错误 发 生 ， 只 是 告诉 外 部 调用 者 ， 迭 代 完 成 . 























不 过 ， 友 代 器 也 有 一 些 限 制 ， 例 如 你 不 能 向 后 移动 ， 不 能 回 到 开始 ， 也 不 能 复制 一 个 欠 代 器 . 
如 果 你 要 再 次 (或 者 是 同时 ) 从 代 同 个 对 象 ， 你 只 能 去 创建 另 一 个 迭代 器 对 象 ， 不过， 这 并 不 糟糕 ， 

















$ 
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因为 还 有 其 他 的 工具 来 帮助 你 使 用 迭代 器 . 











reversed) 内 建 函 数 将 返回 一 个 反 序 访问 的 迭代 器 . enumerate() 内 建 函 数 同样 也 返回 迭代 器 . 
另外 两 个 新 的 内 建 函数 ，any() 和 all() ， 在 Python 2.5 中 新 增 ， 如 果 迭 代 器 中 某 个 /所 有 条 目 
的 值 都 为 布尔 真 时 ， 则 它们 返回 值 为 真 . 本章 先 前 部 分 我 们 展示 了 如 何在 for 循环 中 通过 索引 或 是 
可 和 迭代 对 象 来 遍历 条 目 ， 同 时 Python 还 提供 了 一 整个 itertools BEER, CaS KIA H AIA 
SH. 























8.11. 4 使 用 迭代 器 
=== 序 列 === 


正如 先前 提 到 的 ， 友 代 Python 的 序列 对 象 和 你 想像 的 一 样 : 


2» myTuple = (123, ‘xyz’, 45. 67) 
2 i = iter (myTuple) 

225» i. next () 

123 

2> i. next () 


xyz J 
22» i. next 0 
45. 67 


2225 i. next 0 
Traceback (most recent call last): 
File, line J, in P 


Stoplteration 








如 果 这 是 一 个 实际 应 用 程序 ， 那 么 我 们 需要 把 代码 放 在 一 个 try-except KH. FIMES H 
动 地 产生 它们 自己 的 迭代 器 ， 所 以 一 个 for 循环 : 


for i in seq: 
do something to(i) 


实际 上 是 这 样 工作 的 : 


fetch = iter (seq) 
while True: 
try: 
i = fetch. next Q 
except Stoplteration: 
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break 
do something to(i) 








不 过 ， 你 不 需要 改动 你 的 代码 ， 因 为 for 循环 会 自动 调用 迭代 器 的 next 0 方法 (以 及 监视 


StopIteration 异常 ). 











字典 和 文件 是 另外 两 个 可 迭代 的 Python 数据 类 型 . 字典 的 迭代 器 会 遍历 它 的 键 (keys) . 
语句 for eachKey in myDict.keys() 可 以 缩写 为 for eachKey in myDict ， 例 如 : 





22^ legends = { (Poe’, 'author'): (1809, 1849, 1976), 
C Gaudi’, architect’): (1852, 1906, 1987), 
( Freud’, 'psychoanalyst'): (1856, 1939, 1990) 
.J 


222» for eachLegend in legends: 
print 'Name: %s\tOccupation: %s’ % eachLegend 
print ’ Birth: %s\tDeath: %s\tAlbum: %s\n’ | 
% legends [eachLegend/ 


Name: Freud Occupation: psychoanalyst 
Birth: 1856 Death: 1939 | Album: 1990 


Name: Poe Occupation: author 
Birth: 1809 Death: 1849 Album: 1976 


Name: Gaudi Occupation: architect 
Birth: 1852 Death: 1906 Album: 1987 





Jh Python 还 引进 了 三 个 新 的 内 建 字典 方法 来 定义 迭代 : myDict. iterkeys() (通过 keys 3A 


代 )，myDict. itervalues() (通过 values 3848), WAR myDicit. iteritems() (通过 key/value 对 
KIER). YER, in 操作 符 也 可 以 用 于 检查 字典 的 key 是 否 存 在 ， 之 前 的 布尔 表达 式 
myDict.has key(anyKey) 可 以 被 简写 为 anyKey in myDict . 








--- 文 件 --- 








文件 对 象 生 成 的 迭代 器 会 自动 调用 readline () 方法 . 这样， 循环 就 可 以 访问 文本 文件 的 所 有 
程序 员 可 以 使 用 更 简单 的 for eachLine in myFile 替换 for eachLine in 





myFile. readlines () 
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2» myFile = open( config-win. txt’) 
222 for eachLine in myFile: 
print eachLine, # comma suppresses extra |n 





[EditorWindow] 
font-name: courier new 
font-size: 10 

> myFile. close Q 


8. 11. 5 可 变 对 象 和 迭代 器 


记 住 ， 在 迭代 可 变 对 象 的 时 候 修改 它们 并 不 是 个 好 主意 .这 在 迭 代 器 出 现 之 前 就 是 一 个 问题 . 
一 个 流行 的 例子 就 是 循环 列表 的 时 候 删 除 满足 (或 不 满足 ) 特定 条 件 的 项 : 


for eachURL in allukls: 
if not eachURL. startswith( http:// ): 
allURLs. remove (eachURL) # YIKES!! 


除 列 表 外 的 其 他 序列 都 是 不 可 变 的 ， 所 以 危险 就 发 生 在 这 里 .一 个 序列 的 迭代 器 只 是 记录 你 
当前 到 达 第 多 少 个 元 素 ， 所 以 如 果 你 在 迭代 时 改变 了 元 素 ， 更 新 会 立即 反映 到 你 所 迭代 的 条 目 上 . 
在 迭代 字典 的 key 时 ， 你 绝对 不 能 改变 这 个 字典 ， 使 用 字典 的 keysO 方法 是 可 以 的 ， 因 为 
keys Q 返回 一 个 独立 于 字典 的 列表 .而 迭代 器 是 与 实际 对 象 绑 定 在 一 起 的 ， 它 将 不 会 继续 执行 下 
去 : 








D> myDict = Ca’: L Bud ° e: 3, ws 
222 for eachKey in myDict: 
print eachKey, myDict[eachKey/ 
del myDict[eachKey] 
. al 
Traceback (most recent call last): 
File ^^ line l, in ? 
huntimeError: dictionary changed size during iteration 


TT DRAM. ES GIANTS PEP 234 . 











8. 11. 6 如 何 创建 迭代 器 
对 一 个 对 象 调用 iter() 就 可 以 得 到 它 的 迭代 器 ， 它 的 语法 如 下 : 








$— 一 * 一 











Edit By Vheavens 


t 





Edit By Vheavens 


ee 


iter (obj) 
iter (func, sentinel ) 


如 果 你 传递 一 个 参数 给 iter() ， 它 会 检查 你 传递 的 是 不 是 一 个 序列 ， 如 果 是 ， 那 么 很 简单 : 
根据 索引 从 0 一 直达 代 到 序列 结束 .， 男 一 个 创建 迭代 器 的 方法 是 使 用 类 ， 我 们 将 在 第 13 章 详 细 
介绍 ， 一 个 实现 了 iter O 和 nextO 方法 的 类 可 以 作为 近代 器 使 用 . 











如 果 是 传递 两 个 参数 给 iter0 ， 它 会 重复 地 调用 func, BRR EES 


sentinel . 


8. 12 列表 解析 


列表 解析 ( List comprehensions， 或 缩 略 为 list comps) 来 自 函 数 式 编 程 语 言 Haskell. 它 
是 一 个 非常 有 用 ， 简 单 ， 而 且 灵 活 的 工具 ， 可 以 用 来 动态 地 创建 列表 .， EE Python 2.0 中 被 加 入 . 











在 第 11 章 ， 函 数 中 ， 我 们 将 讨论 Python 早 就 支持 的 函数 式 编程 特性 ， 例 如 lambda, mapO ， 


以 及 filter() 等 ， 这 些 存在 于 Python 中 已 经 很 长 时 间 了 ， 但 通过 列表 解析 ， 它 们 可 以 被 简化 
为 一 个 列表 解析 式 子 ， map 0 对 所 有 的 列表 成 员 应 用 一 个 操作 ，filter 0 基于 一 个 条 件 表达 式 过 
滤 列 表 成 员 ， 最 后 ，lambda 人 允许 你 快速 地 创建 只 有 一 行 的 函数 对 象 ， 你 不 需要 现在 就 去 掌握 这 些 ， 
在 本 节 中 你 将 看 到 它们 出 现在 例子 里 ， 因 为 我 们 需要 讨论 列表 解析 的 优势 .首先 让 我 们 看 看 列表 
解析 的 语法 : 




















[expr for iter var in iterable] 


这 个 语句 的 核心 是 for 循环 ， 它 迭代 iterable 对 象 的 所 有 条 目 . 前 边 的 expr 应 用 于 序列 
的 每 个 成 员 ， 最 后 的 结果 值 是 该 表达 式 产生 的 列表 .迭代 变量 并 不 需要 是 表达 式 的 一 部 分 . 


























这 里 用 到 了 第 11 章 的 一 些 代码 ， 它 有 一 个 计算 序列 成 员 的 平方 的 lambda 函数 表达 式 : 


22» map(lambda x: x ** 2 range(6)) 
[0 L 4 9, 16 25] 


RATE ELSE FH P Te CE DAL PA Ae ET OR E E : 


205 [x ** 2 for x in range (6) / 
[0 l1 4 9, 16, 25] 





在 新 语句 中 ， 只 有 一 次 函数 调用 ( rane) )， 而 先前 的 语句 中 有 三 次 函数 调用 (range) , 
mapO ， 以 及 lambda )， 你 也 可 以 用 括号 包 住 表达 式 ， 象 [(x ** 2) for x in range(6)] 这样， 更 
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便于 阅读 ， 列 表 解 析 的 表达 式 可 以 取代 内 建 的 map) 函数 以 及 lambda ， 而 且 效率 更 高 ， 结合 i 
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语句 ， 列 表 解 析 还 提供 了 一 个 扩展 版 本 的 语法 : 


获 








[expr for iter var in iterable if cond expr] 
这 个 语法 在 迭代 时 会 过 滤 / 捕 获 满 足 条 件 表达 式 cond expr 的 序列 成 员 . 
回想 下 oddO 函数 ， 它 用 于 判断 一 个 数值 对 象 是 奇数 还 是 偶数 (奇数 返回 1 ， 偶 数 返 回 0 ): 


def odd(n): 
return n % 2 


我 们 可 以 借用 这 个 函数 的 核心 操作 ， 使 用 filter() 和 lambda 挑选 出 序列 中 的 奇数 : 
2» seq = [11, 10, 9, 9 10, 10, 9 8 23, 9, 7 18, 12, 11, 12] 
2» filter(lambda x: x % 2, seg) 
HL 9 9, 9, 23, 9. 7, 117 
和 先前 的 例子 一 样 ， 即 使 不 用 filter O 和 lambda， 我 们 同样 可 以 使 用 列表 解析 来 完成 操作 ， 
得 想 要 的 数字 : 
2» [x for x in seq if x % 2J 


LH. 9, 9, 9, 23, 9, 7, JJ 
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一 -矩阵 样 例 --- 








你 需要 迭代 一 个 有 三 行 五 列 的 矩阵 么 ”很 简单 : 





225 [(xtl, y*1) for x in range(3) for y in range(5) ] 
[4 D, 4, 2, £L 3, IL V, 4+ 8), C D, (2 2, (2 
3, C VY, 4.25). C De C 2, B Dy (3 V, (3 SJ 


一 = 磁盘 文件 样 例 === 





假设 我 们 有 如 下 这 样 一 个 数据 文件 hhga. txt ， 需 要 计算 出 所 有 非 空 白字 符 的 数目 : 





And the Lord spake, saying, "First shalt thou take 
out the Holy Pin. Then shalt thou count to three, 
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no more, no less. Three shall be the number thou shalt 
count, and the number of the counting shall be three. 
Four shalt thou not count, nei- ther count thou two, 
excepting that thou then proceed to three. Five is 
right out. Once the number three, being the third 
number, be reached, then lobbest thou thy Holy Hand 
Grenade of Antioch towards thy foe, who, being 
naughty in My sight, shall snuff it." 


我 们 已 经 知道 可 以 通过 for line in data 迭代 文件 内 容 ， 不 过 ， 除 了 这 个 ， 我 们 还 可 以 把 每 
{Ty 9 (C split ) 为 单词 ， 然 后 我 们 可 以 像 这 样 计算 单词 个 数 : 


2» f = open( hhga. txt’, 'r') 
2»» len([word for line in f for word in line. split (]) 
91 


快速 地 计算 文件 大 小 
import os 


22» os. stat ( hhga. txt’). st size 
499L 


假定 文件 中 至 少 有 一 个 空白 字符 ， 我 们 知道 文件 中 有 少 于 499 个 非 空 字符 .我 们 可 以 把 每 个 
单词 的 长 度 加 起 来 ， 得 到 和 |. 











>> f. seek (0) 
2» sum([len(word) for line in f for word in line. split 0 /) 
408 





这 里 我 们 用 seekQ 函数 回 到 文件 的 开头 ， 因 为 迭代 器 已 经 访问 完了 文件 的 所 有 行 ， 一 个 清晰 
明了 的 列表 解析 完成 了 之 前 需要 许多 行 代码 才能 完成 的 工作 ! WRAL, SR DT SCS BRE 
for 循环 以 及 多 个 if 子 句 .完整 的 语法 可 以 在 官方 文档 中 找到 .你 也 可 以 在 PEP 202 中 找到 更 多 
关于 列表 解析 的 资料 . 














8. 13 生成 器 表达 式 





生成 器 表达 式 是 列表 解析 的 一 个 扩展 .在 Python 2.0 中 我 们 加 入 了 列表 解析 ， 使 语言 有 了 一 
次 革命 化 的 发 展 ， 提 供给 用 户 了 一 个 强大 的 工具 ， 只 用 一 行 代码 就 可 以 创建 包含 特定 内 容 的 列表 . 
你 可 以 去 问 一 个 有 多 年 Python 经 验 的 程序 员 是 什么 改变 了 他 们 编写 Python 程序 的 方式 ， 那 么 列 




















$— —$— 
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使 用 一 行列 表 解 析 代 码 做 所 有 的 事 ， 如 果 这 个 文件 的 大 小 变 得 很 大 ， 那 么 这 行 代 码 的 内 存 性 能 会 很 
低 ， 因 为 我 们 要 创建 一 个 很 长 的 列表 用 于 存放 单词 的 长 度 . 





表 解 析 一 定 会 是 最 多 的 答案 . 





AAE Python 版 本 2.2 时 被 加 入 的 另 一 个 重要 特性 是 生成 器 ， 生成 器 是 特定 的 函数 ， 允 许 





你 返回 一 个 值 ， 然 后 “暂停 代码 的 执行 ， 稍 后 恢复 ， 我 们 将 在 第 11 章 中 讨论 生成 器 . 











列表 解析 的 一 个 不 足 就 是 必要 生成 所 有 的 数据 ， 用 以 创建 整个 列表 .这 可 能 对 有 大 量 数 据 的 迭 





代 器 有 负面 效应 ， 生 成 器 表达 式 通 过 结合 列表 解析 和 生成 器 解决 了 这 个 问题 . 








生成 器 表达 式 在 Python 2.4 被 引入 ， 它 与 列表 解析 非常 相似 ， 而 且 它 们 的 基本 语法 基本 相同 ; 











不 过 它 并 不 真正 创建 数字 列表 ， 而 是 返回 一 个 生成 器 ， 这 个 生成 器 在 每 次 计算 出 一 个 条 目 后 ， 把 这 
个 条 目 “ 产 生 ”(yield) 出 来 ， 生 成 器 表达 式 使 用 了 “延迟 计算 “(lazy evaluation)， 所 以 它 在 使 用 
内 存 上 更 有 效 . 我 们 来 看 看 它 和 列表 解析 到 底 有 多 相似 : 











列表 解析 : 


[expr for iter var in iterable if cond expr] 


生成 器 表达 式 : 


(expr for iter var in iterable if cond expr) 














成 器 地 方 . 下 面 我 们 提供 了 一 些 使 用 生成 器 表达 式 的 例子 ， 最 后 例 举 一 个 兄长 的 样 例 ， 从 它 你 可 
以 感觉 到 Python 代码 在 这 些 年 来 的 变化 . 





生成 器 并 不 会 让 列表 解析 废弃 ， 它 只 是 一 个 内 存 使 用 更 友好 的 结构 ， 基 于 此 ， 有 很 多 使 用 生 . 


=== 磁 盘 文件 样 例 === 





在 前 边 列表 解析 一 节 ， 我 们 计算 文本 文件 中 非 空白 字符 总 和 .最 后 的 代码 中 ， 我 们 展示 了 如 何 

















为 了 避免 创建 庞大 的 列表 ， 我 们 可 以 使 用 生成 器 表达 式 来 完成 求 和 操作 ， 它 会 计算 每 个 单词 的 








长 度 然后 传递 给 sum() 函数 ( 它 的 参数 不 仅 可 以 是 列表 ， 还 可 以 是 可 迭代 对 象 , 比如 生成 器 表达 式 ). 
这 样 ， 我 们 可 以 得 到 优化 后 的 代码 (代码 长 度 ， 还 有 执行 效率 都 很 高 效 ) : 








>> sum(len(word) for line in data for word in line. split Q) 
408 


我 们 所 做 的 只 是 把 方 括号 删除 : 少 了 两 字 节 ， 而 且 更 节省 内 存 ..， 非常 地 环保 ! 





== 交叉 配对 例子 === 
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生成 器 表达 式 就 好 像 是 懒惰 的 列表 解析 (这 反而 成 了 它 主 要 的 优势 )， 它 还 可 以 用 来 处 理 其 他 列 
表 或 生成 器 ， 例 如 这 里 的 rows 和 cols : 























rows = IL 2 3, 171 


def cols(): # example of simple generator 
yield 56 
yield 2 
yield 1 








不 需要 创建 新 的 列表 ， 直 接 就 可 以 创建 配对 .我 们 可 以 使 用 下 面 的 生成 器 表达 式 : 





x product pairs = ((i, j) for i in rows for j in cols) 


现在 我 们 可 以 循环 x product pairs ， 它 会 懒惰 地 循环 rows 和 cols : 





222 for pair in x product pairs: 
print pair 


(1, 56) 
(71, 2) 
(1 1) 
(2, 56) 
(2 2) 
G D 
(3, 56) 
(3, 2) 
(3 d) 
(17, 56) 
(17 2) 
G7, D 


=== 重 构 样 例 === 





我 们 通过 一 个 寻找 文件 最 长 的 行 的 例子 来 看 看 如 何 改进 代码 .在 以 前 ， 我 们 这 样 读 取 文 件 : 


f = open( /etc/motd', 'r') 
longest = 0 
while True: 
linelen = len(f. readline 0. strip O) 
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If not linelen: 
break 
If linelen > longest: 





longest - linelen 
f. close 0) 
return longest 





事实 上 ， 这 还 不 够 老 ， 真 正 的 旧版 本 Python 代码 中 ， 布 尔 常量 应 该 写 是 整数 1 ， 而 且 我 们 应 
该 使 用 string 模块 而 不 是 字符 串 的 stripO 方法 : 








import string 
len(string. strip (£. readline ())) 


从 那 时 起 ， 我 们 认识 到 如 果 读 取 了 所 有 的 行 ， 那 么 应 该 尽早 释放 文件 资源 ， 如果 这 是 一 个 很 多 
进程 都 要 用 到 的 日 志文 件 ， 那 么 理所当然 我 们 不 能 一 直 拿 着 它 的 句柄 不 释放 .是 的 ， 我 们 的 例子 是 
用 来 展示 的 ， 但 是 你 应 该 得 到 这 个 理念 ， 所 以 读 取 文件 的 行 的 首选 方法 应 该 是 这 样 : 























了 了 


f = open( /etc/motd', 'r') 
longest = 0 
allLines = f. readlines () 
f. close() 
for line in allLines: 
linelen = len(line. strip) 
If linelen > longest: 
longest - linelen 


return longest 








列表 解析 允许 我 们 稍微 简化 我 们 代码 ， 而 且 我 们 可 以 在 得 到 行 的 集合 前 做 一 定 的 处 理 . 在 下 段 
代码 中 ， 除 了 读 取 文件 中 的 行 之 外 ， 我 们 还 调用 了 字符 串 的 stripQ 方法 处 理 行内 容 . 




















f = open( /etc/motd', 'r') 
longest = 0 
allLines = /x. strip for x in f. readlines()] 
f. close () 
for line in allLines: 
linelen = len(line) 
If linelen > longest: 
longest - linelen 
return longest 





$— 一 * 一 
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然而 ， 两 个 例子 在 处 理 大 文件 时 候 都 有 问题 ， 因 为 readlines() 会 读 取 文件 的 所 有 行 ， 后 来 
我 们 有 了 迭代 器 ， 文 件 本 身 就 成 为 了 它 自 己 的 从 代 器 ， 不 需要 调用 readlinesO 函数 .我 们 已 经 
做 到 了 这 一 步 ， 为 什么 不 去 直接 获得 行 长 度 的 集合 呢 ( 之 前 我 们 得 到 的 是 行 的 集合 )? 这 样 ， 我 们 就 
可 以 使 用 max () 内 建 函数 得 到 最 长 的 字符 串 长 度 : 



































f = open( /etc/motd', 'r') 

allLineLens = [len(x.strip()) for x in f/ 
f. close 0 

return max (allLineLens) 





Xx E E — FS Te pe a EK — AT AT IRR f£. 的 时 候 ， 列 表 解 析 需 要 文件 的 所 有 行 读 取 到 内 存 中 ， 
然后 生成 列表 ， 我 们 可 以 进一步 简化 代码 : 使 用 生成 器 表达 式 蔡 换 列 表 解 机 ， 然 后 把 它 移 到 max O 
函数 里 ， 这 样 ， 所 有 的 核心 部 分 只 有 一 行 : 











f = open( /etc/motd', 'r') 

longest = max (len (x. strip) for x in f) 
f. close Q 

return longest 














: 最 后 ， 我 们 可 以 去 掉 文件 打开 模式 (默认 为 读 取 )， 然 后 让 Python 去 处 理 打开 的 文件 ， 当 然 ， : 
文件 用 于 写 入 的 时 候 不 能 这 么 做 ， 但 这 里 我 们 不 需要 考虑 太 多 : 





return max(len(x.strip()) for x in open( /etc/motd' )) 











我 们 走 了 好 长 一 段 路 ， 注意， 即便 是 这 只 有 一 行 的 Python FEF EDERE. 生成 器 表达 式 
在 Python 2.4 中 被 加 入 ， 你 可 以 在 PEP 289 中 找到 更 多 相关 内 容 . 





8. 14 R 相关 模块 


Python 2.2 引进 了 迭代 器 ， 在 下 一 个 发 行 (2.3) 中 ，itertools 模块 被 加 入 ， 用 来 帮助 那些 
发 现 迭 代 器 威力 但 又 需要 一 些 辅助 工具 的 开发 者 .有 趣 的 是 如 果 你 阅读 关于 itertools 中 实用 程 
序 的 文档 ， 你 会 发 现 生 成 器 .所 以 在 迭代 器 和 生成 器 间 有 一 定 的 联系 .你 可 以 在 第 11 BO” RR’ 
中 了 解 更 多 . 











8.15 练习 


8-1. ”条件 语句 .请 看 下 边 的 代码 














Edit By Vheavens 


Edit By Vheavens 


ee 
T 


# statement A 
if x > 0: 
# statement B 
pass 
elif x <0: 
# statement C 


pass 





else: 
Z statement D 
pass 
# statement E 
(a) 如 果 xc 0 ， 上 面 哪个 语句 (A，B，C，D， 孔 将 被 执行 
(b) 如果 x== 0 ， 上 面 哪个 居于 将 被 执行 ? 
(c) 如果 x> 0 ， 上 面 哪个 语句 将 被 执行 ? 





8-2. 循环 .编写 一 个 程序 ， 让 用 户 输入 三 个 数字 : (f)rom, (t)o, 4H (i)ncrement . 以 i 
为 步 长 ， 从 f 计数 到 t ， 包 括 了 At. 例如， 如 果 输 入 的 是 f == 2, t = 26, i= 4 ， 程 序 
将 输出 2, 6, 10, 14, 18, 22, 26. 








8-3. range) . 如 果 我 们 需要 生成 下 面 的 这 些 列 表 ， 分 别 需要 在 rangeO 内 建 函 数 中 提 
供 那 些 参数 ? 

(a) [0, 1, 2, 3, 4, 5, 6, 7, 8, 9] 

(b) [3, 6, 9, 12, 15, 18] 

(c) [-20, 200, 420, 640, 860] 


























8-4.. 素数， 我们 在 本 章 已 经 给 出 了 一 些 代 码 来 确定 一 个 数字 的 最 大 约 数 或 者 它 是 否 是 一 个 
素数 . 请 把 相关 代码 转换 为 一 个 返回 值 为 布尔 值 的 函数 ， 函 数 名 为 isprimeO . 如果 输入 的 是 一 个 
素数 ， 那 么 返回 True, BURE False . 








8-5. 约 数 .完成 一 个 名 为 getfactorsO 的 函数 . 它 接受 一 个 整数 作为 参数 ， 返 回 它 所 有 
约 数 的 列表 ， 包 括 1 和 它 本 身 ， 





8-6. 素 因 子 分 解 。 以 刚才 练习 中 的 isprime() 和 getfactors() 函数 为 基础 编写 一 个 函 
数 ， 它 接受 一 个 整数 作为 参数 ， 返 回 该 整数 所 有 素数 因子 的 列表 .这 个 过 程 叫 做 求 素 因子 分 解 ， 它 
输出 的 所 有 因子 之 积 应 该 是 原来 的 数字 . 注意 列表 里 可 能 有 重复 的 元 素 ， 例 如 输入 20 ， 返 回 结果 
应 该 是 [2，2，5] . 

















8-7. 全数 ， 完 全数 被 定义 为 这 样 的 数字 : 它 的 约 数 (不 包括 它 自 己 ) 之 和 为 它 本 身 ， 例如 : 6 
的 约 数 是 1 2，3， 因 为 1+ 2+3=6， 所 以 6 被 认为 是 一 个 完全 数 ， 编 写 一 个 名 为 isperfect 0 
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的 函数 ， 它 接受 一 个 整数 作为 参数 ， 如 果 这 个 数字 是 完全 数 ， 返 回 1 ; 否则 返回 0 . 








8-8. NÆ. 一 个 数 的 阶乘 被 定义 为 从 1 到 该 数字 所 有 数字 的 乘积 . N 的 阶乘 简写 为 NI. 
写 一 个 函数 ， 指 定 N， 返 回 N! 的 值 . 


8-9. Fibonacci 数列 . Fibonacci 数列 形 如 1，1，2，3，5，8，13，21， 等 等 ， 也 就 是 说 ， 
下 一 个 值 是 序列 中 前 两 个 值 之 和 .， 写 一 个 函数 ， 给 定 N ， 返 回 第 N 个 Fibonacci 数字 例如， 第 
1 个 Fibonacci 数字 是 1 ， 第 6 个 是 8. 








8-10. XÆ. 统计 一 句 话 中 的 元 音 ， 辅 音 以 及 单词 (以 空格 分 割 ) 的 个 数 . 忽略 元 音 和 
辅音 的 特殊 情况 ， 如 “h”，”y”，“qu” 等 .附加 题 : 编写 处 理 这 些 特殊 情况 的 代码 . 


























8-11. ”文本 处 理 . 要 求 输入 一 个 姓名 列表 ， 输 入 格式 是 “Last Name, First Name,” BJ st, 
过 号 ， 名 .编写 程序 处 理 输入 ， 如 果 用 户 输入 错误 ， 比 如 “First Name Last Name,” ， 请 纠正 这 
# 错 误 ， 并 通知 用 户 ， 同 时 你 还 需要 记录 输入 错误 次 数 ， 当 用 户 输入 结束 后 ， 给 列表 排序 ， 然 后 以 
"hk, ， 名 ”的 顺序 显示 . 

输入 输出 示例 (你 不 需要 完全 按照 这 里 里 例子 完成 ) : 

% nametrack. py 

Enter total number of names: 5 




















UE i 





Please enter name 0: Smith, Joe 

Please enter name 1: Mary Wong 

22 Wrong format... should be Last, First. 

> You have done this 1 time(s) already. Fixing input... Please enter name 2: Hamilton, 
Gerald 

Please enter name 3: Royce, Linda 

Please enter name 4: Winston Salem 

22 Wrong format... should be Last, First. 

22^ You have done this 2 time(s) already. Fixing input... 


The sorted list (by last name) is: 
Hamilton, Gerald 
Royce, Linda 
Salem, Winston 
Smith, Joe 
Wong, Mary 


8-12. (整数 ) 位 操作 ， 编 写 一 个 程序 ， 用 户 给 出 起 始 和 结束 数字 后 给 出 一 个 下 面 这 样 的 表格 ， 
分 别 显示 出 两 个 数字 间 所 有 整数 的 十 进 制 ， 二 进 制 ， 八 进 制 和 十 六 进 制 表示 .如 果 字 符 是 可 打印 的 
ASCII 字符 ， 也 要 把 它 打印 出 来 ， 如 果 没 有 一 个 是 可 打印 字符 ， 就 省 略 掉 ASCII 那 一 栏 的 表 头 . 
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请 参考 下 面 的 输入 输出 格式 : 


SAMPLE OUTPUT 1 
Enter begin value: 9 
Enter end value: 18 
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DEC BIN ocT 

9 01001 11 
10 01010 12 
11 01011 13 
12 01100 14 
13 01101 15 
14 01110 16 
15 01111 17 
16 10000 20 
17 10001 21 
18 10010 22 


Enter begin value: 26 
Enter end value: 41 


DEC BIN OCT 
26 011010 32 
27 011011 33 
28 011100 34 
29 011101 35 
30 011110 36 
31 011111 37 
32 100000 40 
33 100001 41 
34 100010 42 
39 100011 43 
36 100100 44 
37 100101 45 
38 100110 46 
39 100111 47 
40 101000 50 
41 101001 Sl 


= m oe x» t+ 





8 - 13， 程 序 执行 性 能 ， 在 8.5.2 节 里 ， 我 们 介绍 了 两 种 基本 的 选 代 序 列 方法 : (1) 通过 序列 
项 ， 以 及 (2) 通过 序列 索引 遍历 ， 该 小 节 的 末尾 我 们 指出 后 一 种 方法 在 序列 很 长 的 时 候 性 能 不 佳 


(在 我 的 系统 下 ， 性 能 差 了 将 近 两 倍 [83%]) 你 认为 它 的 原因 是 什么 ? 
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文件 对 象 
文件 内 建 函 数 
文件 内 建 方法 
文件 内 建 属性 
标准 文件 
命令 行 参数 
文件 系统 
文件 执行 
持久 存储 
相关 模块 
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本 章 将 深入 介绍 Python 的 文件 处 理 和 相关 输入 输出 能 力 . 我 们 将 介绍 文件 对 象 ( 它 的 内 建 函 
数 ， 内 建 方 法 和 属性 )， 标 准 文件 ， 同 时 讨论 文件 系统 的 访问 方法 ， 文 件 执行 ， 最 后 简洁 地 涉及 持 
久 存 储 和 标准 库 中 与 文件 有 关 的 模块 . 





























9. 1 文件 对 象 


文件 对 象 不 仅 可 以 用 来 访问 普通 的 磁盘 文件 ， 而 且 也 可 以 访问 任何 其 它 类 型 抽象 层面 上 的 “ 文 
F. 一 旦 设置 了 合适 的 “钩子 ”， 你 就 可 以 访问 具有 文件 类 型 接口 的 其 它 对 象 ， 就 好 像 访问 的 是 普 
通 文件 一 样 . 




















随 着 你 使 用 Python 经 验 的 增长 ,您 会 遇 到 很 多 处 理 ” 类 文件 “对 象 的 情况 .有 很 多 这 样 的 例子 ， 
例如 实时 地 “打开 一 个 URL 来 读 取 Web 页 面 ， 在 男 一 个 独立 的 进程 中 执行 一 个 命令 进行 通讯 ， 就 好 
像 是 两 个 同时 打开 的 文件 ， 一 个 用 于 读 取 ， 男 个 用 于 写 入 . 




















内 建 函数 open O. 返回 一 个 文件 对 象 (参见 下 一 小 节 ) ， 对 该 文件 进行 后 继 相 关 的 操作 都 要 用 到 
E. 还 有 大 量 的 函数 也 会 返回 文件 对 象 或 是 类 文件 ( file-like ) 对 象 . 进行 这 种 抽象 处 理 的 主要 原 
因 是 许多 的 输入 /输出 数据 结构 更 趋向 于 使 用 通用 的 接口 ， 这样 就 可 以 在 程序 行为 和 实现 上 保持 一 
致 性 ， 甚 至 像 Unix 这 样 的 操作 系统 把 文件 作为 通信 的 底层 架构 接口 .请 记 住 ， 文 件 只 是 连续 的 字 
节 序 列 ， 数 据 的 传输 经 常会 用 到 字 节 流 ， 无 论 字 贡 流 是 由 单个 字 节 还 是 大 块 数据 组 成 . 



































9.2 文件 内 建 函 数 Lopen (0) 和 file(] 
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作为 打开 文件 之 门 的 “钥匙 ^， 内 建 函 数 open) [以 及 fileO ] 提 供 了 初始 化 输入 /输出 (IZ0) 
操作 的 通用 接口 . open 0 内 建 函 数 成 功 打开 文件 后 时 候 会 返回 一 个 文件 对 象 ， 否 则 引发 一 个 错误 ， 
当 操作 失败 ，Python 会 产生 一 个 IOError 异常 - 我 们 会 在 下 一 章 讨论 错误 和 异 稼 的 处 理 . 内 建 函 
数 openO 的 基本 语法 是 : 





























file object = open(file name, access mode-'r', buffering--1) 





file name 是 包含 要 打开 的 文件 名 字 的 字符 串 ， 它 可 以 是 相对 路 径 或 者 绝对 路 径 ， 可 选 变量 
access mode 也 是 一 个 字符 串 ， 代 表 文 件 打开 的 模式 ， 通常， 文件 使 用 模式 r, w, BE a’ 
模式 来 打开 ， 分 别 代 表 读 取 ， 写 入 和 追加 ， 还 有 个 “U 模式， 代表 通 用 换行 符 支 持 ( 见 下 ). 








使 用 r 或 “JU 模式 打开 的 文件 必须 是 已 经 存在 的 . 使 用 “w 模式 打开 的 文件 若 存在 则 首 
先 清空 ， 然 后 (重新) 创建 .以 “a” 模 式 打 开 的 文件 是 为 妃 加 数据 作 准 备 的 ， 所 有 写 入 的 数据 都 将 
追加 到 文件 的 末尾 .即使 你 seek 到 了 其 它 的 地 方 ， 如 果 文 件 不 存在 ， 将 被 自动 创建 ， 类 似 以 ww 
模式 打开 文件 ， 如 果 你 是 一 个 C 程序 员 ， 就 会 发 现 这 些 也 是 C HERR fopen() 中 使 用 的 模式 . 








EE fopenO 支持 的 模式 也 可 以 工作 在 Python 的 open() TF. 包括 “+ 代表 可 读 可 写 ，’”b 
代表 二 进 制 模式 访问 . 关于，b” 有 一 点 需要 说 明 ， 对 于 所 有 POSIX 兼容 的 Unix 系统 (包括 
Linux) 来 说 ，’b’ 是 可 由 可 无 的 ， 因 为 它们 把 所 有 的 文件 当 作 二 进 制 文件 ， 包 括 文本 文件 ， 下 面 是 
从 Linux 手册 的 fopen() 函数 使 用 中 摘录 的 一 段 ，Python 语言 中 的 openO 函数 就 是 从 它 衍 生 
出 的 : 























站 示 文 件 打开 模式 的 字符 串 中 也 可 以 包含 字符 “b”， 但 它 不 能 做 为 第 一 个 字符 出 现 . 这 样 做 的 
目的 是 为 了 严格 地 满足 ANSI C3.159-1989 (BJ ANSI C) 中 的 规定 ; 事实 上 它 没有 任何 效果 ， 所 有 
POSIX 兼容 系统 ， 包 括 Linux, MAAK b” (其 它 系 统 可 能 会 区 分 文本 文件 和 二 进 制 文件 ， 如 果 
你 要 处 理 一 个 二 进 制 文件 ， 并 希望 你 的 程序 可 以 移植 到 其 它 非 Unix 的 环境 中 ， 加 上 “pb” 会 是 不 错 的 
主意 ) 。 









































你 可 以 在 表 9.1 中 找到 关于 文件 访问 模式 的 详细 列表 ， 包 括 “b” 的 使 用 - 如 果 你 选择 使 用 
它 的 话 ， 如 果 没 有 给 定 access mode ， 它 将 自动 采用 默认 值 r. 





男 外 一 个 可 选 参 数 buffering 用 于 指示 访问 文件 所 采用 的 缓冲 方式 .其 中 0 表示 不 缓冲 ，1 
表示 只 缓冲 一 行 数据 ， 任 何其 它 大 于 1 的 值 代表 使 用 给 定 值 作为 缓冲 区 大 小 .不 提供 该 参数 或 者 
给 定 负 值 代表 使 用 系统 默认 缓冲 机 制 ， 既 对 任何 类 电报 机 ( tty ) 设备 使 用 行 缓冲 ， 其 它 设备 使 用 正 
常 缓冲 .一 般 情 况 下 使 用 系统 默认 方式 即 可 . 














表 9.1 文件 对 象 的 访问 模式 


文件 模式 操作 
r 以 读 方式 打开 
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rU BR Ua ”以 读 方式 打开 ， 同 时 提供 通用 换行 符 支持 (PEP 278) 

以 写 方式 打开 (必要 时 清空 
B 以 追加 模式 打开 (从 EOF 开始 ， 必 要 时 创建 新 文件 ) 
m 以 读 写 模式 打开 
a 
a 





e 











以 读 写 模式 打开 (参见 w ) 
+ 以 读 写 模式 打开 (参见 a ) 
sb 以 二 进 制 读 模式 打开 





























wb 以 二 进 制 写 模式 打开 (参见 w ) 

ab 以 二 进 制 追 加 模式 打开 (参见 a ) 
rb+ 以 二 进 制 读 写 模式 打开 (参见 r+ ) 
wb+ 以 二 进 制 读 写 模式 打开 (参见 w+ ) 
abt 以 二 进 制 读 写 模式 打开 (参见 at ) 
a. Python 2.3 中 新 增 





这 里 是 一 些 打开 文件 的 例子 : 


fp = open( /etc/motd') # Ute AZ AHH 
fp = open( test’, °w) # KAZAN 
fp = open( data’, 'r*') # UAH 


fp = open(r’c: \io. sys’, 'rb') # U RENERT SF 


9.2.1 工厂 函数 fileQ 


在 Python 2.2 中 ， 类 型 和 类 被 统一 了 起 来 ， 这 时 ， 加 入 了 内 建 函 数 file). Hm, REWA 
建 类 型 没有 对 应 的 内 建 函 数 来 创建 对 象 的 实例 。 例 如 dictO, ，boo10，file0， 等 等 ， 然 而 ， 另 一 
些 却 有 对 应 的 内 建 函 数 ， 例 如 listO, strO, 4555. 


























openO 和 fileO 函数 具有 相同 的 功能 ， 可 以 任意 替换 . 
您 所 看 到 任何 使 用 openO 的 地 方 ， 都 可 以 使 用 file) R'E. 


可 以 预见 ， 在 将 来 的 Python 版 本 中 ，open() 和 fileO 函数 会 同时 存在 ， 完 成 相同 的 功能 . 
一 般 说 来 ， 我 们 建议 使 用 openO 来 读 写 文件 ， 在 您 想 说 明 您 在 处 理 文件 对 象 时 使 用 fileO ， 例 
如 if instance(f, file). 








9. 2. 2 通用 换行 符 支 持 (UNS) 


在 下 一 个 核心 笔记 中 ， 我 们 将 介绍 如 何 使 用 os 模块 的 一 些 属性 来 帮助 你 在 不 同 平台 下 访问 文 
件 ， 不 同 平台 用 来 表示 行 结束 的 符号 是 不 同 的 ， 例 如 \n，\r， 或 者 \r\n . 所 以 ，Python 的 解释 
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器 也 要 处 理 这 样 的 任务 ， 特 别 是 在 导入 模块 时 分 外 重要 。 你 难道 不 希望 Python 用 相同 的 方式 处 理 
所 有 文件 吗 ? 























这 就 是 UNS 的 关键 所 在 ， 作 为 PEP 278 的 结果 ，Python 2.3 引入 了 UNS. 当 你 使 用 U 标志 
打开 文件 的 时 候 ， 所 有 的 行 分 割 符 (或 行 结束 符 ， 无 论 它 原 来 是 什么 ) 通过 Python 的 输入 方法 ( 例 
如 read Q ) 返 回 时 都 会 被 蔡 换 为 换行 符 NEWLINE(\n). CrU 模式 也 支持 "“rb” 选 项 ) .这 个 特性 
还 支持 包含 不 同类 型 行 结 束 符 的 文件 ， 文 件 对 象 的 newlines 属性 会 记录 它 兽 “看 到 的 ”文件 的 行 结 
RE. 









































如 果 文 件 刚 被 打开 ， 程 序 还 没有 遇 到 行 结 束 符 ， 那 么 文件 的 newlines W None .在 第 一 行 被 读 
取 后 ， 它 被 设置 为 第 一 行 的 结束 符 ， 如 果 遇 到 其 它 类 型 的 行 结 束 符 ， 文 件 的 newlines 会 成 为 一 个 
含 每 种 格式 的 元 组 . 注意 UNS 只 用 于 读 取 文 本 文件 ， 没有 对 应 的 处 理 文 件 输出 的 方法 . 





























在 编译 Python 的 时 候 ，UNS 默认 是 打开 的 .如果 你 不 需要 这 个 特性 ， 在 运行 configure 脚本 
时 ， 你 可 以 使 用 --without-universal-newlines 开关 关闭 它 . 如 果 你 非 要 自己 处 理 行 结束 符 ， 请 
查阅 核心 笔记 ， 使 用 os 模块 的 相关 属性 . 























—s- 


9. 3 文件 内 建 方 法 





open) 成 功 执行 并 返回 一 个 文件 对 象 之 后 ， 所 有 对 该 文件 的 后 续 操 作 都 将 通过 这 个 “句柄 ? 进 
行 ， 文 件 方法 可 以 分 为 四 类 : 输入 ， 输 出 ， 文 件 内 移动 ， 以 及 杂项 操作 . 所 有 文件 对 象 的 总 结 被 
列 在 了 表 9.3. 我们 现在 来 讨论 每 个 类 的 方法 . 











9. 3.1 输入 





read) 方法 用 来 直接 读 取 字 节 到 字符 串 中 ， 最 多 读 取 给 定数 目 个 字 节 ， 如 果 没 有 给 定 size 
参数 (默认 值 为 -1) 或 者 size 值 为 负 ， 文 件 将 被 读 取 直 至 末尾 ， 未 来 的 某 个 版 本 可 能 会 删除 此 方 

















YA. 














readline) 方法 读 取 打开 文件 的 一 行 ( 读 取 下 个 行 结束 符 之 前 的 所 有 字 节 ). 然后 整 行 ， 包 括 行 
结束 符 ， 作 为 字符 串 返 回 ， 和 readO 相同 ， 它 也 有 一 个 可 选 的 size 参数 ， 默 认为 -1， 代 表 读 至 
行 结 束 符 ， 如 果 提 供 了 该 参数 ， 那 么 在 超过 size 个 字 贡 后 会 返回 不 完整 的 行 . 


wu 




















readlines() 方法 并 不 像 其 它 两 个 输入 方法 一 样 返回 一 个 字符 串 ， 它 会 读 取 所 有 (剩余 的 ) AT 
后 把 它们 作为 一 个 字符 串 列 表 返 回 ， 它 的 可 选 参数 sizhint 代表 返回 的 最 大 字 节 大 小 .如 果 它 大 























于 0 ， 那 么 返回 的 所 有 行 应 该 大 约 有 sizhint 字 节 (可 能 稍微 大 于 这 个 数字 ， 因 为 需要 凌 齐 缓冲 区 
大 小 ). 
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Python 2.1 中 加 入 了 一 个 新 的 对 象 类 型 用 来 高 效 地 迭代 文件 的 行 : xreadlines 对 象 (可 以 在 
xreadlines 模块 中 找到 ). 调用 file.xreadlinesO 等 价 于 xreadlines. xreadlines (file). 
xreadlines() 不 是 一 次 性 读 取 取 所 有 的 行 ， 而 是 每 次 读 取 一 块 ， 所 以 用 在 for 循环 时 可 以 减少 对 
内 存 的 占用 . 不 过 ， 随 着 Python 2.3 中 迭代 器 和 文件 迭代 的 引入 ， 没 有 必要 再 使 用 xreadlines () 
方法 ， 因 为 它 和 使 用 iter(file) 的 效果 是 一 样 的 ， 或 者 在 for 循环 中 ， 使 用 for eachLine in 
file RBE. EKER Z, EER. 


























另 个 废弃 的 方法 是 readinto() ， 它 读 取 给 定数 目的 字 节 到 一 个 可 写 的 缓冲 器 对 象 ， 和 废弃 的 
buffer) 内 建 函 数 返回 的 对 象 是 同 个 类 型 . (由 于 buffer) 已 经 不 再 支持 ， 所 以 readinto() 被 
废弃 . ) 





9. 3. 2 输出 








wite) 内 建 方法 功能 与 read() 和 readline) 相反 . 它 把 含有 文本 数据 或 二 进 制 数据 块 的 
字符 捉 写 入 到 文件 中 去 . 








和 readlinesO 一 样 ，writelines() 方法 是 针对 列表 的 操作 ， 它 接受 一 个 字符 串 列 表 作 为 参 
数 ， 将 它们 写 入 文件 . 行 结束 符 并 不 会 被 自动 加 入 ， 所 以 如 果 需 要 的 话 ， 你 必须 在 调用 
writelines (前 给 每 行 结尾 加 上 行 结束 符 . 








注意 这 里 并 没有 “writeline()” 方法， 因为 它 等 价 于 使 用 以 行 结束 符 结尾 的 单行 字符 串 调用 
write() 方法 . 





核心 笔记 : 保留 行 分 隔 符 

当 使 用 输入 方法 如 read() 或 者 readlines() 从 文件 中 读 取 行 时 ，Python 并 不 会 删除 行 结束 
符 .， 这 个 操作 被 留 给 了 程序 员 . 例如 这 样 的 代码 在 Python 程序 中 很 常见 : 

f = open( myFile', 'r') 

data = [line.strip() for line in f.readlines()] 

f. close Q 

类 似 地 ， 输 出 方法 wite) 或 writelinesO 也 不 会 自动 加 入 行 结 束 符 ， 你 应 该 在 向 文件 写 
入 数据 前 自己 完成 : 


9.3.3 文件 内 移动 


seek 方法 (类 似 C 中 的 fseekO 函数 ) 可 以 在 文件 中 移动 文件 指针 到 不 同 的 位 置 . offset 
字 节 代表 相对 于 某 个 位 置 偏 移 量 . 位置 的 默认 值 为 0 ， 代 表 从 文件 开头 算 起 ( 即 绝对 偏 移 量 )，1 代 
表 从 当前 位 置 算 起 , 2 代表 从 文件 末尾 算 起 .如 果 你 是 一 个 C 程序 员 ， 并 且 使 用 过 了 fseekO , 3H 
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A, 0, L 2 分 别 对 应 着 常量 SEEK SET, SEEK CUR， 以 及 SEEK END， 当 人 们 打开 文件 进行 读 写 操 
作 的 时 候 就 会 接触 到 seek () 方 法 。 





text) 方法 是 对 seekO 的 补充 ; 它 告 诉 你 当前 文件 指针 在 文件 中 的 位 置 - 从 文件 起 始 算 起 ， 
EULA TH, 


9. 3. 3 文件 迭代 
一 行 一 行 访问 文件 很 简单 : 


for eachLine in f: 


在 这 个 循环 里 ，eachLine 代表 文本 文件 的 一 行 (包括 末 尾 的 行 结束 符 )， 你 可 以 使 用 它 做 任何 想 
做 的 事情 . 








在 Python 2.2 之 前 ， 从 文件 中 读 取 行 的 最 好 办 法 是 使 用 file. readlines() 来 读 取 所 有 数据 ， 
这 样 程序 员 可 以 尽快 释放 文件 资源 .如果 不 需 要 这 样 做 ， 那 么 程序 员 可 以 调用 file.readlineO 
一 次 读 取 一 行 ， 曾 有 一 段 很 短 的 时 间 ，file. xreadlines() 是 读 取 文件 最 高 效 的 方法 . 

















在 Python 2.2 中 ， 我 们 引进 了 迭代 器 和 文件 迭代 ， 这 使 得 一 切 变 得 完全 不 同 ， 文 件 对 象 成 为 
了 它们 自己 的 迭代 器 ， 这 意味 着 用 户 不 必 调 用 read* () 方法 就 可 以 在 for 循环 中 迭代 文件 的 每 一 行 . 
另外 我 们 也 可 以 使 用 欠 代 器 的 next 方法 ，file.next() 可 以 用 来 读 取 文件 的 下 一 行 ， 和 其 它 迭 代 
4&— hf, Python 也 会 在 所 有 行 迭代 完成 后 引发 StopIteration 异常 . 

















所 以 请 记得 ， 如 果 你 见 到 这 样 的 代码 ， 这 是 “完成 事情 的 老 方法 “”， 你 可 以 安全 地 删除 对 
readlineO 的 调用 . 





for eachLine in f. readline(): 





文件 迭代 更 为 高 效 ， 而 且 写 〈 和 读 ) 这 样 的 Python 代码 更 容易 。 如果 你 是 Python HA, Al 
么 请 使 用 这 些 新 特性 ， 不 必 担 心 它 们 过 去 是 如 何 . 





9. 3.5 其 它 











close) 通过 关闭 文件 来 结束 对 它 的 访问 .Python 垃圾 收集 机 制 也 会 在 文件 对 象 的 引用 计数 降 
至 零 的 时 候 自 动 关闭 文件 ， 这 在 文件 只 有 一 个 引用 时 发 生 ， 例 如 fp = open(...), Wea fp 在 原文 
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fr. 如果 你 不 显 式 地 关闭 文件 ， 那 么 你 可 能 丢失 输出 缓冲 区 的 数据 . 

















filenoO 方法 返回 打开 文件 的 描述 符 ， 这 是 一 个 整数 ， 可 以 用 在 如 os 模块 ( os. read() ) 的 
一 些 底层 操作 上 . 








调用 flush() 方法 会 直接 把 内 部 缓冲 区 中 的 数据 立刻 写 入 文件 ， 而 不 是 被 动 地 等 待 输出 缓冲 
区 被 写 入 ，isatty() 是 一 个 布尔 内 建 函 数 ， 当 文件 是 一 个 类 tty 设备 时 返回 True ， 和 否则 返回 
False . truncate) 方法 将 文件 截取 到 当前 文件 指针 位 置 或 者 到 给 定 size ， 以 字 节 为 单位 . 











9.3.6 文件 方法 杂项 





我 们 现在 重新 实现 第 二 章 中 的 第 一 个 文件 例子 : 


filename = raw input( Enter file name: ') 
f - open(filename, 'r') 
allLines = f. readlines () 

f. close Q 


for eachLine in allLines: 
print eachLine, # suppress print’ s NEWLINE 


我 们 曾经 介绍 过 这 个 程序 ， 与 大 多 数 标准 的 文件 访问 方法 相 比 ， 它 的 不 同 在 于 它 读 完 所 有 的 行 
才 开始 向 屏幕 输出 数据 ， 很 明显 如 果 文 件 很 大 ， 这 个 方法 并 不 好 .这 时 最 好 还 是 回 到 最 可 靠 的 方法 : 
使 用 文件 迭代 器 ， 每 次 只 读 取 和 显示 一 行 : 



































filename = raw input( Enter file name: ') 
f - open(filename, 'r') 
for eachLine in f: 

print eachLine, f. close() 


核心 笔记 : 行 分 隔 符 和 其 它 文 件 系统 的 差异 

操作 系统 间 的 差异 之 一 是 它们 所 支持 的 行 分 隔 符 不 同 . 在 POSIX (Unix 系列 或 Mac OS X) 系统 
上 ， 行 分 隔 符 是 换行 符 NEWLINE ( \n ) 字符 . 在 旧 的 MacOS 下 是 RETURN ( \r ) ， 而 DOS 和 
Wind32 系统 下 结合 使 用 了 两 者 ( \rNn ). 检查 一 下 你 所 使 用 的 操作 系统 用 什么 行 分 隔 符 。 

另 个 不 同 是 路 径 分 隔 符 (POSIX fig "/^, DOS 和 Windows 使 用 “\“， 旧 版 本 的 MacOS 使 用 
“:”)， 它 用 来 分 隔 文 件 路 径 名 ， 标 记 当 前 目录 和 父 目 录 . 

当 我 们 创建 要 跨 这 三 个 平台 的 应 用 的 时 候 ， 这 些 差异 会 让 我 们 感觉 非常 麻烦 〈 而 且 支 持 的 平台 
越 多 越 麻烦 )。 幸 运 的 是 Python 的 os 模块 设计 者 已 经 帮 有 我们 想到 了 这 些 问题 . os 模块 有 五 个 很 
有 用 的 属性 .它们 被 列 在 了 表 9.2 中 . 
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Table 9.2 有 助 于 跨 平台 开发 的 os 模块 属性 
os 模块 属性 描述 





linesep 用 于 在 文件 中 分 隔行 的 字符 串 

Sep 用 来 分 隔 文 件 路 径 名 的 字符 串 

pathsep 用 于 分 隔 文 件 路 径 的 字符 串 

curdir 当前 工作 目录 的 字符 串 名 称 

pardir (当前 工作 目录 的 ) 父 目录 字符 串 名 称 


不 管 你 使 用 的 是 什么 平台 ， 只 要 你 导入 了 os 模块 ， 这 些 变 量 自动 会 被 设置 为 正确 的 值 ， 减 少 
了 你 的 麻烦 . 








还 要 提醒 大 家 的 是 : print 语句 默认 在 输出 内 容 末尾 后 加 一 个 换行 符 ， 而 在 语句 后 加 一 个 去 号 
就 可 以 避免 这 个 行为 readline() 和 readlines() 函数 不 对 行 里 的 空白 字符 做 任何 处 理 ( 参 见 本 章 
练习 )， 所 以 你 有 必要 加 上 速 号 ， 如 果 你 省 略 喜 号 ， 那 么 显示 出 的 文本 每 行 后 会 有 两 个 换行 符 ， 其 
中 一 个 是 输入 是 附带 的 ， 另 个 是 print 语句 自动 添加 的 . 




















文件 对 象 还 有 一 个 truncate) 方法 ， 它 接受 一 个 可 选 的 size 作为 参数 . 如果 给 定 ， 那 么 文 
件 将 被 截取 到 最 多 size 字 节 处 .如 果 没 有 传递 size 参数 ， 那 么 默认 将 截取 到 文件 的 当前 位 置 . 
例如 ， 你 刚 打 开 了 一 个 文件 ， 然 后 立即 调用 truncate () 方法 ， 那 么 你 的 文件 (内容 ) 实际 上 被 删除 ， 
这 时 候 你 是 其 实 是 从 0 字 节 开始 截取 的 ( tell 将 会 返回 这 个 数值 ). 











在 学 习 下 一 小 节 之 前 ， 我 们 再 来 看 两 个 例子 ， 第 一 个 展示 了 如 何 输出 到 文件 ， 第 二 个 展示 了 
文件 的 输出 和 输入 ， 以 及 用 于 文件 定位 的 seekO 和 tellO 方法 的 使 用 . 








filename = raw input( Enter file name: ') 
fobj = open (filename, °w’) 
while True: 
aLine = raw input( Enter a line (.' to quit): ^) 
if aine /= 7; 
fobj. write(  físfís' % (aLine, os. linesep) 
else: 
break 
fob j. close () 


这 里 我 们 每 次 从 用 户 接 收 一 行 输入 ， 然 后 将 文本 保存 到 文件 中 .由 于 raw input O 不 会 保留 用 
户 输 入 的 换行 符 ， 调 用 write() 方法 时 必须 加 上 换行 符 。 而 且 ， 在 键盘 上 很 难 输 入 一 个 
EOF (end-of-file) 字 符 ， 所 以 ， 程 序 使 用 句号 4 ，) 作为 文件 结束 的 标志 ， 当 用 户 输入 句号 后 会 自动 
结束 输入 并 关闭 文件 . 























第 二 个 例子 以 可 读 可 写 模式 创建 一 个 新 的 文件 (可 能 是 清空 了 一 个 现 有 的 文件 )， 在 加 文件 写 入 
数据 后 ， 我 们 使 用 seekO 方法 在 文件 内 部 移动 ， 使 用 tellO 方法 展示 我 们 的 移动 过 程 . 
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2^ f = open( /tmp/x’, wt’) 
>>> F. tell 


2 fwrite( test line I\n’) # 加 入 一 个 长 为 12 WHIFF [0-11] 
SDD £tello 


> F. writel test line 2|n') # 加 入 一 个 长 为 12 HFE [12-23] 
> f. tell) # GHARVSHHCE 


M9 £seek(C-12, D # FER 12 VEP 
> ftellO # SI fr 


2» f. readline () 
'test line 2|012' 
M» f.seek(0 0) 9 BIET 
2» f. readline () 
'test line 1|012' 
> ftellO # KIISITZE-fr 
12 
2» f. readline () 
'test line 2|012' 
> f. tell) | 8 XS/T£iE 
24 
M9 f.close) # XAXI 








表 9.3 文件 对 象 的 内 建 方法 列表 











文件 对 象 的 方法 操作 

file. close() 关闭 文件 

file. fileno 0 返回 文件 的 描述 符 (file descriptor , FD， 整 数值 ) 

file. flush 0 刷新 文件 的 内 部 缓冲 区 

file.isatty() 判断 file 是 否 是 一 个 类 tty 设备 

file. next? () 返回 文件 的 下 一 行 (类 似 于 file. readline) )， 或 在 没有 其 它 行 时 
引发 StopIteration 异常 

file. read(size--1) 从 文件 读 取 size 个 字 节 ， 当 未 给 定 size 或 给 定 负 值 的 时 候 ， 读 








取 剩 余 的 所 有 字 节 ， 然 后 作为 字符 串 返 回 
file.readinto' (buf, size) 从 文件 读 取 size 个 字 节 到 buf 缓冲 器 (已 不 支持 ) 
file. readline (size=-1) 从 文件 中 读 取 并 返回 一 行 (包括 行 结束 符 )， 或 返回 最 大 size 











$— 一 * 一 
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file. readlines (sizhint=0) 读 取 文件 的 所 有 行 并 作为 一 个 列表 返回 (包含 所 有 的 行 结束 
Tj; ”如 果 给 定 sizhint HAF 0 ， 那 么 将 返回 总 和 大 约 为 
sizhint 字 节 的 行 ( 大 小 由 缓冲 器 容量 的 下 一 个 值 决定 ) 〈 EE 
如 说 缓冲 器 的 大 小 只 能 为 AK 的 倍数 ， 如 果 sizhint 为 15k， 则 
最 后 返回 的 可 能 是 16k 一 一 一 译 者 按 ) 

file. xreadlines'( FAIA, "IUE readlinesO 的 一 个 更 高 效 的 方法 

file.seek(off, whence-0) 在 文件 中 移动 文件 指针 ， 从 whence ( 0 代表 文件 其 始 ，1 4X 
表 当 前 位 置 ，2 代表 文件 末尾 ) 偏 移 off 字 节 


























file. tell() 返回 当前 在 文件 中 的 位 置 

file. truncate(size=file.tellQ) 截取 文件 到 最 大 size 字 节 ， 默 认为 当前 文件 位 置 
file.write(str) 向 文件 写 入 字符 串 

file. writelines (seq) 向 文件 号 入 字符 串 序 列 seq ; seq 应 该 是 一 个 返回 字符 串 的 








可 迭代 对 象 ; 在 2.2 前 ， 它 只 是 字符 串 的 列表 


a. Python 2.2 中 新 增 
b. Python 1.5.2 中 新 增 ， 不 再 支持 
c. Python 2.1 中 新 增 ， 在 Python 2.3 中 废弃 


s 9. 4 文件 内 建 属性 E 


文件 对 象 除 了 方法 之 外 ， 还 有 一 些 数据 属性 . 这 些 属性 保存 了 文件 对 象 相关 的 附加 数据 ， 例 如 
文件 名 (file. name )， 文 件 的 打开 模式 ( file. mode )， 文 件 是 否 已 被 关闭 ( file. closed)， 以 及 
一 个 标志 变量 ， 它 可 以 决定 使 用 print 语句 打印 下 一 行 前 是 否 要 加 入 一 个 空白 字符 
( file. softspace ). 表 9.4 列 出 了 这 些 属性 并 做 了 简短 说 明 。 
























































表 9. 4 文件 对 象 的 属性 

文件 对 象 的 属性 描述 

file.closed True 表示 文件 已 经 被 关闭 ， 否 则 为 False 

file. encoding’ 文件 所 使 用 的 编码 - 当 Unicode 字符 串 被 写 入 数据 时 ， 它 们 将 自动 使 
用 file. encoding 转换 为 字 节 字符 串 ; A file. encoding 为 None 时 使 
用 系统 默认 编码 

file. mode 文件 打开 时 使 用 的 访问 模式 

file. name 文件 名 

file. newlines’ 未 读 取 到 行 分 隔 符 时 为 None ， 只 有 一 种 行 分 隔 符 时 为 一 个 字符 串 ， 当 
文件 有 多 种 类 型 的 行 结 束 符 时 ， 则 为 一 个 包含 所 有 当前 所 遇 到 的 行 结束 
符 的 列表 

file. softspace 为 0 表示 在 输出 一 数据 后 ， 要 加 上 一 个 空格 符 ，1 表示 不 加 。 这 个 属性 
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a. New in Python 2.3. 





一 般 程 序 员 用 不 着 ， 由 程序 内 部 使 用 。 














9. 5 标准 文件 





一 般 说 来 ， 只 要 你 的 程序 一 执行 ， 那 么 你 就 可 以 访问 三 个 标准 文件 ， 它 们 分 别 是 标准 输入 (一 
般 是 键盘 )， 标 准 输出 (到 显示 器 的 缓冲 输出 ) 和 标准 错误 (到 屏幕 的 非 缓冲 输出 ). (这 里 所 说 的 “缓冲 
“和 “ 非 缓冲 是 指 open() 函数 的 第 三 个 参数 .) 这 些 文件 沿用 的 是 C 语言 中 的 命名 ， 分 别 为 
stdin , stdout 和 stderr . 我们 说 “只 要 你 的 程序 一 执行 就 可 以 访问 这 三 个 标准 文件 -， 意 思 是 这 
些 文件 已 经 被 预先 打开 了 ， 只 要 知道 它们 的 文件 句柄 就 可 以 随时 访问 这 些 文件 . 

















Python 中 可 以 通过 sys 模块 来 访问 这 些 文件 的 句柄 ， 导 入 sys 模块 以 后 ， 就 可 以 使 用 
sys. stdin , sys. stdout 和 sys. stderr Wile]. print 语句 通常 是 输出 到 sys.stdout ; MA 
raw_input() 则 通常 从 sys. stdin 接受 输入 . 


























记得 sys.* 是 文件 ， 所 以 你 必须 自己 处 理 好 换行 符 ， 而 print 语句 会 自动 在 要 输出 的 字符 串 
后 加 上 换行 符 。 





sys 模块 通过 sys. argv 属性 提供 了 对 命令 行 参数 的 访问 。 命令 行 参 数 是 调用 某 个 程序 时 除 程 
序 名 以 外 的 其 它 参 数 . 这 样 命名 是 有 历史 原因 的 ， 在 一 个 基于 文本 的 环境 里 (比如 UNIX. 操作 系统 
的 shell 环境 或 者 DOS-shell )， 这 些 参数 和 程序 的 文件 名 一 同 被 输入 的 . 但 在 IDE 或 者 GUI 环 
境 中 可 能 就 不 会 是 这 样 了 ， 大 多 IDE 环境 都 提供 一 个 用 来 输入 “命令 行 参数 “的 窗口 ; 这 些 参数 最 
后 会 像 命令 行 上 执行 那样 被 传递 给 程序 . 





熟悉 C 语言 的 读者 可 能 会 问 了 ，“argc WEI?” arge 和 argv 分 别 代表 参数 个 数 (argument 
count) FIBA [A] st (argument vector). argv 变量 代表 一 个 从 命令 行 上 输入 的 各 个 参数 组 成 的 字符 
串 数组 ; arge 变量 代表 输入 的 参数 个 数 . 在 Python 中 ，argc 其 实 就 是 sys. argv 列表 的 长 度 ， 
而 该 列表 的 第 一 项 sys. argv[0] 永远 是 程序 的 名 称 . 

总 结 如 下 : 

€ sys.argv 是 命令 行 参数 的 列表 

€ len(sys.argv) 是 命令 行 参数 的 个 数 ( 也 就 是 argc) 











我 们 来 创建 这 个 名 为 argv. py 的 测试 程序 : 





[e— 一 * 一 
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import sys 





print 'you entered’, len(sys. argv), 'arguments..."' 
print 'they were:', str(sys.argv) 


下 面 是 该 脚本 程序 运行 的 输出 : 


$ argv. py 76 tales 85 hawk 
you entered 5 arguments... 
they were: [’argv. py’, '76, ‘tales’, '85', 'hawk'/ 


命令 行 参数 有 用 吗 ? Unix 操作 系统 中 的 命令 通常 会 接受 输入 ， 执 行 一 些 功能 ， 然 后 把 结果 作为 
流 输 出 出 来 ， 这 些 输出 的 结果 还 可 能 被 作为 下 一 个 程序 的 输入 数据 ， 在 完成 了 一 些 其 它 处 理 后 ， 青 
把 新 的 输出 送 到 下 一 个 程序 ， 如 此 延伸 下 去 .各 个 程序 的 输出 一 般 是 不 保存 的 ， 这 样 可 以 节省 大 量 
的 磁盘 空间 ， 各 个 程序 的 输出 通常 使 用 “管道 “实现 到 下 个 程序 输入 的 转换 . 






































这 是 通过 向 命令 行 提供 数据 或 是 通过 标准 输入 实现 的 ， 当 一 个 程序 显示 或 是 发 送 它 的 输出 到 标 
准 输出 文件 时 ， 内 容 就 会 出 现在 屏幕 上 - 除非 该 程序 被 管道 连接 到 下 一 个 程序 ， 那 么 此 时 程序 的 
标准 输出 就 成 为 下 个 程序 的 标准 输入 ， 你 现在 明白 了 吧 ? 




















命令 行 参数 使 程序 员 可 以 在 启动 一 个 程序 的 时 候 对 程序 行为 做 出 选择 .在 大 多 情况 下 ， 这 些 . 
执行 操作 都 不 需要 人 为 干预 ， 通 过 批 处 理 执行 .命令 行 参数 配合 程序 选项 可 以 实现 这 样 的 处 理 功 
能 .让 计算 机 在 夜里 有 空 帮 时 完成 一 些 需 要 大 量 处 理 的 工作 . 




















Python 还 提供 了 两 个 模块 用 来 辅助 处 理 命令 行 参数 .其 中 一 个 (最 原始 的 ) getopt 模块 ， 
它 更 简单 些 ， 但 是 不 是 很 精细 . 而 Python 2.3 引入 的 optparse 模块 提供 了 一 个 更 强大 的 工具 ， 
而 且 它 更 面向 对 象 . 如 果 你 只 是 用 到 一 些 简 单 的 选项 ， 我 们 推荐 getopt ， 但 如 果 你 需要 提供 复杂 
的 选项 ， 那 么 请 参阅 optparse . 























9. 7 文件 系统 


对 文件 系统 的 访问 大 多 通过 Python 的 os 模块 实现 ， 该 模块 是 Python 访问 操作 系统 功能 的 主 
要 接口 . os 模块 实际 上 只 是 真正 加 载 的 模块 的 前 端 ， 而 真正 的 那个 “模块 “明显 要 依赖 与 具体 的 操作 
系统 ， 这 个 “真正 ”的 模块 可 能 是 以 下 几 种 之 一 : posix (适用 于 Unix 操作 系统 )，nt (Win32), 
mac (旧版 本 的 MacOS), dos (DOS), os2 (0S/2)， 等 .你 不 需要 直接 导入 这 些 模块 .只 要 导入 os Bi 
Ik, Python 会 为 你 选择 正确 的 模块 ， 你 不 需要 考虑 底层 的 工作 .根据 你 系统 文 持 的 特性 ， 你 可 能 
法 访问 到 一 些 在 其 它 系统 上 可 用 的 属 ， 
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除了 对 进程 和 进程 运行 环境 进行 管理 外 ，os 模块 还 负责 处 理 大 部 分 的 文件 系统 操作 ， 应 用 程序 
开发 人 员 可 能 要 经 常用 到 这 些 ， 这些 功能 包括 删除 / 重 命名 文件 ， 遍 历 目录 树 ， 以 及 管理 文件 访问 
权限 等 ， 表 9.5 列 出 os 模块 提供 的 一 些 常见 文件 或 目录 操作 函数 . 






























































另 一 个 模块 os. path 可 以 完成 一 些 针 对 路 径 名 的 操作 . 它 提供 的 函数 可 以 完成 管理 和 操作 文 
件 路 径 名 中 的 各 个 部 分 ， 获 取 文 件 或 子 目录 信息 ， 文 件 路 径 查 询 等 操作 . R 9.6 列 出 了 os. path 
中 的 几 个 比较 常用 的 函数 . 

















这 两 个 模块 提供 了 与 平台 和 操作 系统 无 关 的 统一 的 文件 系统 访问 方法 . f» 9.1 (ospathex. py) 
展示 了 os 和 os. path 模块 中 部 分 函数 的 使 用 . 


d 9.5 os 模块 的 文件 /目录 访问 函数 
函数 描述 
文件 处 理 
mkfifo() /mknod Q* 创建 命名 管道 /创建 文件 系统 节点 
remove () /unlink() Delete file 删除 文件 
rename()/renames ^ ” 重 命名 文件 



































*stat'() 返回 文件 信息 
symlink () 创建 符号 链接 
utime() E Br EN FR] EX 

$ tmpfile() 创建 并 打开 (4 wb ) 一 个 新 的 临时 文件 E 

walk (O° 生成 一 个 目录 树 下 的 所 有 文件 名 

目录 /文件 夹 

chdir(Q/fchdirQ* 改变 当前 工作 目录 /通过 一 个 文件 描述 符 改 变 当前 工作 目录 

chroot () 改变 当前 进程 的 根 目录 

listdir() 列 出 指定 目录 的 文件 








getcwd() /getcwdu () "返回 当前 工作 目录 /功能 相同 ， 但 返回 一 个 Unicode 对 象 
mkdir ()/makedirs() 创建 目录 /创建 多 层 目 录 
rmdir()/removedirs() ”删除 目录 /删除 多 层 目 录 



































访问 /权限 

access () 检验 权限 模式 

chmod () 改变 权限 模式 

chown () /1chown Q* 改变 owner 和 group ID/ 功 能 相同 ， 但 不 会 跟踪 链接 

umask () 设置 默认 权限 模式 

文件 描述 符 操 作 

open () 底层 的 操作 系统 open (对 于 文件 ， 使 用 标准 的 内 建 openO 函数 ) 
read()/write() ， 根据 文件 描述 符 读 取 / 写 入 数据 

dup () /dup2 () 复制 文件 描述 符号 /功能 相同 ， 但 是 是 复制 到 另 一 个 文件 描述 符 
设备 号 

makedev()* 从 major 和 minor 设备 号 创建 一 个 原始 设备 号 
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major()* /minorO^ 从 原始 设备 号 获得 major/minor 设备 号 





New in Python 2. 3. 

New in Python 1. 5. 2. 

Includes statQ, IstatQ, xstatQ. 
New in Python 2. 2. 


eo fF 


# 9.6 os. path 模块 中 的 路 径 名 访问 函数 











函数 描述 
分 隔 
basename () 去 掉 目 录 路 径 ， 返 回 文件 名 
dirname () 去 掉 文 件 名 ， 返 回 目录 路 径 
join () 将 分 离 的 各 部 分 组 合成 一 个 路 径 名 
split() 返回 (dirname(), basenameO) 元 组 
splitdrive() 返回 (drivename, pathname) 元 组 
splitext () 返回 (filename, extension) 元 组 
= 

getatime () 返回 最 近 访 问 时 间 

getctime () 返回 文件 创建 时 间 

getmtime () 返回 最 近 文 件 修改 时 间 

getsize() 返回 文件 大 小 (以 字 节 为 单位 ) 
查询 
exists) 指定 路 径 ( 文 件 或 目录 ) 是否 存在 
isabs () 指定 路 径 是 否 为 绝对 路 径 





isdir() 指定 路 径 是 否 存在 且 为 一 个 目录 
isfile() ”指定 路 径 是 否 存在 且 为 一 个 文件 
islink() ”指定 路 径 是 否 存在 且 为 一 个 符号 链接 
ismount () 指定 路 径 是 否 存在 且 为 一 个 挂 载 点 
samefile() 两 个 路 径 名 是 否 指向 同 个 文件 








例 9.1 os 和 os. path 模块 例子 (ospathex. py) 


这 上 段 代 码 练 习 使 用 一 些 os 和 os. path 模块 中 的 功能 . 它 创 建 一 个 文本 文件 ， 写 入 少量 数据 ， 
然后 重 命名 ， 输 出 文件 内 容 ， 同 时 还 进行 了 一 些 辅 助 性 的 文件 操作 ， 比 如 遍历 目录 树 和 文件 路 径 名 
处 理 . 











1 #l/usr/bin/env python 
2 
3 import os 


E 





$— E 
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4 for tmpdir in Ĉ/tmp’, r’c:\temp’): 
5 If os. path. isdir(tmpdir): 

6 break 

/ else: 





8 print 'no temp directory available’ 
9 tmpdir = 一 

10 

ll if tmpdir: 

12 os. chdir (tmpdir) 

13 cwd = os. getcwd() 

14 print '*** current temporary directory’ 
15 print cwd 

16 

17 print '*** creating example directory...’ 
18 os. mkdir ( example’ ) 

19 os. chdir( example’) 

20 cwd = os. getcwd() 

21 print '*** new working directory: 

22 print cwd 

23 print '*** original directory listing: 
24 print os. listdir (cwd) 

25 

26 print '*** creating test file...’ 

27 fobj = open( test’, °w 

28 fobj.write( foo\n’) 

29 fobj. write CĈ bar\n’) 

30 fobj. close O 

31 print '*** updated directory listing: 
32 print os. listdir (cwd) 

33 

34 print ^*** renaming ‘test’ to 'filetest. txt’ ^ 
35 os. rename( test’, 'filetest. txt’) 

36 print '*** updated directory listing: 

37 print os. listdir(cwd) 

38 

39 path = os. path. join(cwd, os. listdir (cwd) [0/) 
40 print '*** full file pathname’ 

41 print path 

42 print '*** (pathname, basename) ==" 

43 print os. path. split (path) 
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44 print '*** (filename, extension) ==" 
46 


45 print os. path. splitext (os. path. basename (path) ) 


48 fobj = open (path) 
49 for eachLine in fobj: 


47 print '*** displaying file contents:’ 
50 print eachLine, 





51 fobj. close 0 
52 


53 print '*** deleting test file’ 
54 os. remove (path) 


56 print os. listdir(cwd) 


55 print '*** updated directory listing: 
57 os. chdir (os. pardir) 


58 print '*** deleting test directory’ 
59 os. rmdir ( example’) 


60 print °*** DONE’ 





os 的 子 模块 os. path 更 多 用 于 文件 路 径 名 处 


H 





XX* current temporary directory 
/ tmp 


径 
在 Unix 平台 下 执行 该 程序 ， 我 们 会 得 到 如 下 输出 : 
$ ospathex. py 





比较 常用 的 属性 列 于 表 9.6 中 . 
X** creating example directory... 
xxx new working directory: 
/tmp/examp le 
XXX original directory listing: 
[J 
*** creating test file... 


*** updated directory listing: 
l test’ J 


xxx renaming "test to 'filetest. txt’ 

*** updated directory listing: 

[ filetest. txt' / 

xxx full file pathname: 
/tmp/example/filetest. txt 

xxx (pathname, basename) == 


( /tmp/example', 


'filetest. txt’) 
xxx (filename, extension) == 
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Cfiletest’, ’. txt’) 
*** displaying file contents: 





foo bar 

X** deleting test file 

*** updated directory listing: 
[J 

xxx deleting test directory 
xe DONE 


在 DOS 窗口 下 执行 这 个 例子 我 们 会 得 到 非常 相似 的 输出 : 


C: |-python ospathex. py 
xxx current temporary directory c: |windows|temp 
XX** creating example directory... 
xxx new working directory: 
c: windows | temp example 
X** original directory listing: 
[] 
X** creating test file... 
xxx updated directory listing: 
I test’ J 
xxx renaming "test to 'filetest. txt’ 
*** updated directory listing: 
[’ filetest. txt’ / 
xxx full file pathname: 
c: \windows \temp\example\filetest. txt 
xxx (pathname, basename) == 
(c:\\windows\\temp\\example’, 'filetest. txt’) 
xxx (filename, extension) == 
(filetest', ’. txt’) 
*** displaying file contents: 
foo bar 
X** deleting test file 
*** updated directory listing: 
[] 
*** deleting test directory 
xxx DONE 


这 里 就 不 逐 行 解释 这 个 例子 了 ， 我 们 把 这 个 留 给 读者 做 练习 ， 下 面 我 们 来 看 看 一 个 类 似 的 交互 
式 例子 (包括 错误 ) ， 我 们 会 把 代码 分 成 几 个 小 段 ， 然 后 依次 进行 讲解 . 
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222 import os 

222 os. path. isdir( /tmp') 
True 

222 os. chdir C /tmp’) 

25» cwd = os. getcwd () 
22^ cwd 

not 





代码 的 第 一 部 分 导入 了 os 模块 (同时 也 包含 os. path 模块 )， 然 后 检查 并 确认 “/tmp” 是 一 
个 合法 的 目录 ， 并 切换 到 这 个 临时 目录 开始 我 们 的 工作 ， 之 后 我 们 用 getcwd() 方法 确认 我 们 当前 
位 置 

















2225 os. nkdir( example’) 
222^ os. chdir( example’) 
25^ cwd = os. getcwd () 
25^ cwd 
'"/tmp/example' 
225 
222 os. listdir() # oops, forgot name 
Traceback (innermost last): File “<stdin>”, line l, in ? 
TypeError: function requires at least one argument 
225 
22» os. listdir (cwd) # that's better :) 
[J 











接 下 来 ， 我 们 在 临时 目录 里 创建 了 一 个 子 目 录 ， 然 后 用 listdirO 方法 确认 目录 为 空 (因为 我 
们 刚 创 建 它 )， 第 一 次 调用 listdirO 调用 时 出 现 的 问题 是 因为 我 们 没有 传递 要 列 目录 的 路 径 名 . 
我 们 马上 在 第 二 次 调用 时 修正 了 这 个 失误 . 














2» fobj = open( test’, °w) 
222^ fobj. write( foo|n') 

222^ fobj. write( bar|n') 

222 fobj. close () 

222 os. listdir (cwd) 

l test J 














这 里 我 们 创建 了 一 个 有 两 行内 容 的 test 文件 ， 之 后 列 目录 确认 文件 被 成 功 创建 . 











222 os.rename( test’, 'filetest. txt’) 





$— 一 * 一 
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222 os. listdir (cwd) 
l'filetest. txt’ J 





225 

25» path = os. path. join(cwd, os. listdir (cwd) [0]) 
222 path 

'"/tmp/example/filetest. txt’ 

225 


222 os. path. isfile(path) True 
222 os. path. isdir(path) False 
225 
222 os. path. split (path) 
(/tmp/example’, 'filetest. txt’) 
225 
222 os. path. splitext (os. path. basename (path) ) 
(filetest, ’. ext’) 


这 一 段 代码 使 用 了 os. path 的 一 些 功能 ， 包 括 我 们 之 前 看 到 过 的 join), isfileO, isdirO, 
split, basename (0)， 以 及 splitext() . 我 们 还 调用 了 os 下 的 rename() 函数 ， 接 下 来 ， 我 们 
显示 文件 的 内 容 ， 之 后 ， 删 除 之 前 创建 的 文件 和 目录 : 








2» fobj = open (path) 

222 for eachLine in fobj: 
print eachLine, 

... foo bar 

22» fobj. close? 

222 os. remove (path) 

222 os. listdir (cwd) 

[] 

222 os. chdir (os. pardir) 

» os. rmdir ( example’ ) 


核心 模块 : os (和 os. path ) 

从 上 面 这 些 长 篇 讨论 可 以 看 出 ，os 和 os. path 模块 提供 了 访问 计算 机 文件 系统 的 不 同方 法 . 
我 们 在 本 章 学 习 的 只 是 文件 访问 方面 ， 事实 上 os 模块 可 以 完成 更 多 工作 .我 们 可 以 通过 它 管理 进 
程 环境 ， 甚 至 可 以 让 一 个 Python 程序 直接 与 男 外 一 个 执行 中 的 程序 “对话 “. 你 很 快 就 会 发 现 自己 
离 不 开 这 个 模块 了 .更 多 关于 os 模块 的 内 容 请 参阅 第 14 章 . 


9. 8 文件 执行 
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无 论 你 只 是 想 简 单 地 运行 一 个 操作 系统 命令 ， 调 用 一 个 二 进 制 可 执行 文件 ， 或 者 其 它 类 型 的 脚 
本 (可 能 是 shell 脚本 ，Perl， 或 是 Tcl/Tk) ， 都 需要 涉及 到 运行 系统 其 它 位 置 的 其 它 文件 ， 尽 管 
不 经 常 出 现 ， 但 是 有 时 甚至 会 需要 启动 另外 一 个 Python 解释 器 . 我 们 将 把 这 部 分 内 容留 到 第 14 章 
去 讨论 ， 如 果 读 者 有 兴趣 了 解 如 何 司 动 其 它 程序 , 以 及 如 何 与 它们 进行 通讯 ， 或 者 是 Python 执行 
环境 的 一 般 信 息 ， 都 可 以 在 14 章 里 找到 答案 . 
































9. 9 永久 存储 模块 








在 本 书 的 很 多 练习 里 ， 都 需要 用 户 输入 数据 .这 可 能 需要 用 户 多 次 输入 重复 的 数据 ， 尤 其 是 如 
果 你 要 输入 大 批 数 据 供 以 后 使 用 时 ， 你 表 定 会 厌烦 这 样 做 .这 就 是 永久 储存 大 显 身 手 的 地 方 了 ， 它 
可 以 把 用 户 的 数据 归档 保存 起 来 供 以 后 使 用 ， 这 样 你 就 可 以 避免 每 次 输入 同样 的 信息 ， 在 简单 的 磁 
盘 文件 已 经 不 能 满足 你 的 需要 ， 而 使 用 完整 的 关系 数据 库 管 理 系 统 (relational database 
management systems BJ RDBMS) 又 有 些 大 材 小 用 时 ， 简 单 的 永久 性 储存 就 可 以 发 挥 它 的 作用 ， 大 部 
分 永久 性 储存 模块 是 用 来 储存 字符 串 数据 的 ， 但 是 也 有 方法 来 归档 Python 对 象 . 






























































9.9.1 pickle 和 marshal 模块 


以 用 来 转换 并 储存 Python 对 象 ， 该 过 程 将 比 基 本 类 型 复杂 的 对 象 转换 为 一 个 二 进 制 数据 集合 ， 
这 样 就 可 以 把 数据 集合 保存 起 来 或 通过 网 络 发 送 ， 然 后 再 重新 把 数据 集合 恢复 原来 的 对 象 格式 . 
这 个 过 程 也 被 称 为 数据 的 局 平 化 ， 数 据 的 序列 化 ， 或 者 数据 的 顺序 化 .另外 一 些 模块 
(dbhash/bsddb, dbm,  gdbm, dumbdbm 等 ) 以 及 它们 的 “管理 器 “( anydbm ) 只 提供 了 Python 字 
符 串 的 永久 性 储存 ， 而 最 后 一 个 模块 (4 shelve ) 则 两 种 功能 都 具备 . 


Python 提供 了 许多 可 以 实现 最 小 化 永久 性 储存 的 模块 . 其 中 的 一 组 ( marshal 和 pickle ) 可 






































我 们 已 经 提 到 marshal 和 pickle 模块 都 可 以 对 Python 对 象 进 行 储 存 转 换 ， 这些 模块 本 身 
并 没有 提供 “永久 性 储存 “的 功能 ， 因 为 它们 没有 为 对 象 提供 名 称 空 间 ， 也 没有 提供 对 永久 性 储存 对 
象 的 并 发 写 入 访问 ( concurrent write access ). 它们 只 能 储存 转换 Python 对 象 ， 为 保存 和 传输 
提供 方便 .数据 储存 是 有 次 序 的 (对 象 的 储存 和 传输 是 一 个 接 一 个 进行 的 )，marshal 和 pickle 模 
块 的 区 别 在 于 marshal 只 能 处 理 简单 的 Python 对 象 (数字 ， 序 列 ， 上 映射 ， 以 及 代码 对 象 )， 而 
pickle 还 可 以 处 理 递归 对 象 ， 被 不 同 地 方 多 次 引用 的 对 象 ， 以 及 用 户 定 义 的 类 和 实例 . pickle tH 
块 还 有 一 个 增强 的 版 本 叫 cPickle ， 使 用 C 实现 了 相关 的 功能 . 
























































9.9. 2 DBM 风格 的 模块 


*db* 系列 的 模块 使 用 传统 的 DBM 格式 写 入 数据 ，Python 提供 了 DBM 的 多 种 实现 : 
dbhash/bsddb, dbm, ^ gdbm, 以 及 ”dumbdbm 等 ,你 可 以 随便 按照 你 的 爱好 使 用 ， 如 果 你 不 确定 
的 话 ， 那 么 最 好 使 用 anydbm 模块 ， 它 会 自动 检测 系统 上 已 安装 的 DBM 兼容 模块 ， 并 选择 “最 好 ” 
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能 最 少 的 一 个 ， 在 没有 其 它 模块 可 用 时 ，anydbm 才 会 选择 它 ， 这 些 模 块 


的 一 个 .dumbdbm 模块 是 功能 最 
为 用 户 的 对 象 提供 了 一 个 命名 空间 ， 这 些 对 象 同时 有 具备 字典 对 象 和 文件 对 象 的 特点 .不 过 不 足 之 处 


在 于 它们 只 能 储存 字符 串 ， 不 能 对 Python 对 象 进行 序列 化 . 


9. 9. 3 shelve 模块 


最 后 ， 我 们 来 看 一 个 更 为 完整 的 解决 方案 ，shelve 模块 . shelve 模块 使 用 anydbm 模块 寻找 
合适 的 DBM 模块 ， 然 后 使 用 cPickle 来 完成 对 储存 转换 过 程 . shelve 模块 允许 对 数据 库 文 件 进行 
并 发 的 读 访问 ， 但 不 允许 共享 读 / 写 访问 .这 也 许 是 我 们 在 Python 标准 库 里 找到 的 最 接近 于 永久 
性 储存 的 东西 了 .可 能 有 一 些 第 三 方 模块 实现 了 “真正 ”的 永久 性 储存 . 9-1 展示 了 储存 转换 模 
块 与 永久 性 储存 模块 之 间 的 关系 ， 以 及 为 何 shelve 对 象 能 成 为 两 者 的 最 好 的 选择 的 . 








提供 Python 对 象 的 序列 化 
或 储存 转换 功能 


提供 一 个 类 世 宇 典 和 立 件 的 对 


旭 ， 可 以 充 成 字符 审 的 永久 性 
fat 


shelve 


ett Python 对 象 的 序列 化 和 铺 存 转 执 ， 以 及 类 
RUBIO 可 以 完成 Python SERA 





图 9-1 用 于 序列 化 和 永久 性 储存 的 Python 模块 
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核心 模块 : pickle 和 cPickle 

你 可 以 使 用 pickle 模块 把 Python 对 象 直接 保存 到 文件 里 ， 而 不 需要 把 它们 转化 为 字符 串 ， 
也 不 用 底层 的 文件 访问 操作 把 它们 写 入 到 一 个 二 进 制 文件 里 . pickle 模块 会 创建 一 个 Python 语言 
专用 的 二 进 制 格式 ， 你 不 需要 考虑 任何 文件 细节 ， 它 会 帮 你 干净 利索 地 完成 读 写 对 象 操 作 ， 唯 一 需 
要 的 只 是 一 个 合法 的 文件 句柄 . 

pickle 模块 中 的 两 个 主要 函数 是 dump() 和 load) .dump () 函数 接受 一 个 文件 句柄 和 一 个 
数据 对 象 作为 参数 ， 把 数据 对 象 以 特定 格式 保存 到 给 定 文 件 里 ， 当 我 们 使 用 loadO 函数 从 文件 中 
取出 已 保存 的 对 象 时 ，pickle 知道 如 何 恢复 这 些 对 象 到 它们 本 来 的 格式 . 我 们 建议 你 看 一 看 
pickle 和 更 “聪明 ”的 shelve 模块 ， 后 者 提供 了 字 — 典 式 的 文件 对 象 访问 功能 ， 进 一 步 减 少 了 程序 
员 的 工作 . 

cPickle 是 pickle 的 一 个 更 快 的 C 语言 编译 版 本 . 


9. 10 相关 模块 








还 有 大 量 的 其 它 模块 与 文件 和 输入 /输出 有 关 ， 它 们 中 的 大 多 数 都 可 以 在 主流 平台 上 工作 . 表 
9.7 列 出 了 一 些 文件 相关 的 模块 








表 9.7 文件 相关 模块 

模块 内 容 

base64 提供 二 进 制 字 符 串 和 文本 字符 串 间 的 编码 /解码 操作 

binascii 提供 二 进 制 和 ASCII 编码 的 二 进 制 字符 串 间 的 编码 /解码 操作 
bz2* 访问 BZ2 格式 的 压缩 文件 

csv 访问 csv 文件 GES ah CFF) 
filecmp” 用 于 比较 目录 和 文件 

fileinput ”提供 多 个 文本 文件 的 行 迭 代 器 
getopt/optparse' ”提供 了 命令 行 参数 的 解析 /处 理 
glob/fnmatch ”提供 Unix 样式 的 通配符 匹配 的 功能 
gzip/zlib i GNU zip( gzip) 文件 (压缩 需要 zlib 模块 ) 
































































































































shutil 提供 高 级 文件 访问 功能 

c/StringI0 对 字符 串 对 象 提供 类 文件 接口 
tarfile 该 写 TAR JJF, SCREHSHROCTE 
tempfile ”创建 一 个 临时 文件 (名 ) 

uu 格式 的 编码 和 解码 





zipfile 用 于 读 取 ZIP 归档 文件 的 工具 
a. New in Python 2.3. 
b. New in Python 2. 0. 
C. New in Python 1.6. 





fileinput 模块 遍历 一 组 输入 文件 ， 每 次 读 取 它 们 内 容 的 一 行 ， 类 似 Perl 语言 中 的 不 带 参 数 
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glob 和 fnmatch 模块 提供 了 老式 Unix shell 样式 文件 名 的 模式 匹配 ， 例 如 使 用 星 号 ( * ) 通 
配 符 代表 任意 字符 串 ， 用 问号 ( ? ) 匹配 任意 单个 字符 . 











的 “<>” 操 作 符 ， 如 果 没 有 明确 给 定 文件 名 ， 则 默认 从 命令 行 读 取 文件 名 . 


























核心 提示 : 使 用 os. path. expanduser() 的 波浪 号 ( ^) 进行 扩展 

虽然 glob 和 fnmatch 提供 了 Unix 样式 的 模式 匹配 ， 但 它们 没有 提供 对 波浪 号 (用 户 目录 ) 
字符 ，” 的 支持 . 你 可 以 使 用 os.path.expanduser () 函数 来 完成 这 个 功能 ， 传 递 一 个 带 波浪 号 的 
目录 ， 然 后 它 会 返回 对 应 的 绝对 路 径 ， 这 里 是 两 个 例子 ， 分 别 运 行 在 Unix 和 Win32 环境 下 : 

>>> os. path. expanduser (’ ~/py’ ) 

' /home/wesley/py' 


>>> os. path. expanduser (’ ~/py’ ) 

*C:\\Documents and Settings\\wesley/py’ 

另外 Unix 家 族 系 统 还 支持 “user” 这 样 的 用 法 ， 表 示 指 定 用 户 的 目录 . WA, HER Win32 
版 本 函数 没有 使 用 反 斜 杠 来 分 隔 目 录 路 径 . 


gzip 和 zlib 模块 提供 了 对 zlib 压缩 库 直 接 访问 的 接口 .gzip 模块 是 在 zlib 模块 上 编写 
的 ， 不 但 实现 了 标准 的 文件 访问 ， 还 提供 了 自动 的 gzip 压缩 /解压 缩 . bz2 类 似 于 gzip ， 用 于 

















操作 bzip 压缩 的 文件 . 

程序 员 可 以 通过 1.6 中 新 增 的 zipfile 模块 创建 ， 修 改 和 读 取 zip 归档 文件 . ( tarfile 
文件 实现 了 针对 tar 归档 文件 的 相同 功能 ). 在 2.3 版 本 中 ，Python 加 入 了 导入 归档 zip 文件 
中 模块 的 功能 ， 更 多 细节 请 参阅 12.5.7 小 节 . 

















shutil 模块 提供 高 级 的 文件 访问 功能 ， 包 括 复制 文件 ， 复 制 文件 的 访问 权限 ， 递 归 地 目录 树 


复制 ， 等 等 . 








tempfile 模块 用 于 生成 临时 文件 (名 ). 


在 关于 字符 串 一 章 中 ， 我 们 介绍 了 StringlO 模块 (和 它 的 C 语言 版 本 cStringI0 )， 并 且 介 
绍 了 它 是 如 何在 字符 串 对 象 项 层 加 入 文件 操作 接口 的 ， 这 个 接口 包括 文件 对 象 的 所 有 标准 方法 . 




















我 们 在 前 面 永久 性 储存 一 节 ( 9.9 节 ) 中 介绍 的 模块 还 有 文件 和 字典 对 象 混合 样式 的 例子 . 











其 它 的 Python 类 文件 对 象 还 有 网 络 和 文件 socket 对 象 ( socket 模块 )， 用 于 管道 连接 的 
popen*() 文件 对 象 (os 和 popen2 模块 )， 用 于 底层 文件 访问 的 fdopenO 文件 对 象 (os 模块 )， 通 
过 URL ( Uniform Resource Locator 统一 资源 定位 器 ) 建立 的 到 指定 web 服务 器 的 网 络 连接 
( urllib 模块 ) 等 ， 需 要 注意 的 是 并 非 所 有 的 标准 文件 方法 都 能 在 这 些 对 象 上 实现 ， 同 样 的 ， 这 些 
对 象 也 提供 了 一 些 普通 文件 没有 的 功能 . 
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有 具体 内 容 请 参考 这 些 模块 的 相关 文档 ， 你 可 以 在 下 边 这 些 地 址 中 找到 关于 fileO/openO , X 
件 ， 文 件 对 象 的 更 多 信息 . 

http://docs. python. org/lib/built-in-funcs. html 

http: //docs. python. org/lib/bltin-file-objects.html 

http://www. python. org/doc/2. 3/whatsnew/node’7. html 

http://www. python. org/doc/peps/pep-0278/ 





9.11 练习 


9-1. 文件 过 滤 . 显示 一 个 文件 的 所 有 行 ， 忽 略 以 井 号 ( 8 ) 开 头 的 行 ， 这 个 字符 被 用 做 
Python ，Perl，Tcl， 等 大 多 脚本 文件 的 注释 符号 . 
附加 题 : 处 理 不 是 第 一 个 字符 开头 的 注释 . 








9-2. ”文件 访问 ， 提 示 输 入 数字 N 和 文件 FE， 然后 显示 文件 F 的 前 N fT. 





9-3. ”文件 信息 ， 提 示 输 入 一 个 文件 名 ， 然 后 显示 这 个 文本 文件 的 总 行 数 . 





9-4. 文件 访问 ， 写 一 个 逐 页 显示 文本 文件 的 程序 ， 提 示 输 入 一 个 文件 名 ， 每 次 显示 文本 
文件 的 25 行 ， 暂 停 并 向 用 户 提 示 “ 按 任意 键 继续 .“， 按 键 后 继续 执行 . 





9-5. 考试 成 绩 ， 改 进 你 的 考试 成 绩 问题 (练习 5 -3 和 6-4)， 要 求 能 从 多 个 文件 中 读 入 考 
试 成 绩 ， 文 件 的 数据 格式 由 你 自己 决定 . 





9-6. 文件 比较 . 写 一 个 比较 两 个 文本 文件 的 程序 ， 如 果 不 同 ， 给 出 第 一 个 不 同 处 的 行 号 和 
列 写 . 





9-7. 解析 文件 .Win32 用 户 : 创建 一 个 用 来 解析 Windows . ini 文件 的 程序 ，POSIX 用 户 : 
创建 一 个 解析 /etc/serves 文件 的 程序 ， 其 它 平台 用 户 : 写 一 个 解析 特定 结构 的 系统 配置 文件 的 
程序 . 








9-8. 模块 研究 ， 提 取 模 块 的 属性 资料 ， 提 示 用 户 输入 一 个 模块 名 (或 者 从 命令 行 接 受 输入 ). 
然后 使 用 dir) 和 其 它 内 建 函数 提取 模块 的 属性 ， 显 示 它 们 的 名 字 ， 类 型 ， 值 . 














9-9. Python 文档 字符 串 ， 进 入 Python 标准 库 所 在 的 目录 . 检查 每 个 .py 文件 看 是 否 有 
_ doc ”字符 串 ， 如 果 有 ， 对 其 格式 进行 适当 的 整理 归 类 .你 的 程序 执行 完毕 后 ， 应 该 会 生成 一 个 
漂亮 的 清单 .里边 列 出 哪些 模块 有 文档 字符 串 ， 以 及 文档 字符 串 的 内 容 ， 清单 最 后 附 上 那些 没有 文 
档 字 符 串 模块 的 名 字 ， 

附加 题 : 提取 标准 库 中 各 模块 内 全 部 类 (class) 和 函数 的 文档 . 
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9-10.  ZXKEPEWM. Gg —^ ZZ REREIM Ee. MATET ng EAD, scmi, EMTA, E 
期 存款 等 多 种 帐户 .为 每 种 帐户 提供 一 个 菜单 操作 界面 ， 要 有 存款 ， 取 款 ， 借 ， 贷 等 操作 .另外 还 
要 提供 一 个 取消 操作 选项 ， 用 户 退 出 这 个 程序 时 相关 数据 应 该 保存 到 文件 里 去 (出 于 备份 的 目的 ， 
程序 执行 过 程 中 也 要 备份 . ) 









































9-11. Web 站 点 地 址 . 

a) 编写 一 个 URL 书签 管理 程序 .使 用 基于 文本 的 菜单 ， 用 户 可 以 添加 ， 修 改 或 者 删除 书签 数 
据 项 ， 书 签 数 据 项 中 包含 站 点 的 名 称 ，URL 地 址 ， 以 及 一 行 简单 说 明 ( 可 选 )， 另 外 提供 检索 功能 ， 
可 以 根据 检索 关键 字 在 站 点 名 称 和 URL 两 部 分 查找 可 能 的 匹配 . 程序 退出 时 把 数据 保存 到 一 个 磁 
盘 文 件 中 去 ; 再 次 执行 时 候 加 载 保存 的 数据 . 



































pb) 改进 a) 的 解决 方案 ， 把 书签 输出 到 一 个 合法 且 语 法 正确 的 HTML 文件 (.html 或 htm ) 中 ， 
这 样 用 户 就 可 以 使 用 浏览 器 查看 自己 的 书签 清单 .另外 提供 创建 “文件 夹 * 功 能 ， 对 相关 的 书签 进行 
分 组 管理 . 


























附加 题 : 请 阅读 Python 的 re 模块 了 解 有 关 正 则 表达 式 的 资料 ， 使 用 正则 表达 式 对 用 户 输入 
的 URL 进行 验证 . 











9-12. 用 户 名 和 密码 . 
回顾 练习 7-5 ， 修 改 代码 使 之 可 以 支持 ”上 次 登录 时 间 “. 请 参阅 time 模块 中 的 文档 了 解 如 
何 记录 用 户 上 次 登录 的 时 间 . 另外 提供 一 个 “系统 管理 员 “， 它 可 以 导出 所 有 用 户 的 用 户 名 ， 密 码 

(如 果 想 要 的 话 ， 你 可 以 把 密码 加 密 )， 以 及 “上 次 登录 时 间 ”. 

a) 数据 应 该 保存 在 磁盘 中 ， 使 用 冒号 ( : ) 分 割 ， 次 写 入 一 行 ， 例 如 
“joe:boohoo:953176591. 145”“， 文 件 中 数据 的 行 数 应 该 等 于 你 系统 上 的 用 户 数 . 

b) 进一步 改进 你 的 程序 ， 不 再 一 次 写 入 一 行 ， 而 使 用 pickle 模块 保存 整个 数据 对 象 ， 请 参 
阅 pickle 模块 的 文档 了 解 如 何 序列 化 /扁平 化 对 象 ， 以 及 如 何 读 写 保存 的 对 象 ， 一般 来 说 ， 这 个 
解决 方案 的 代码 行 数 要 比 a) 的 少 . 

c) 使 用 shelve 模块 替换 pickle 模块 ， 由 于 可 以 省 去 一 些 维护 代码 ， 这 个 解决 方案 的 代码 比 





























9-13. 命令 行 参 数 
a) 什么 是 命令 行 参数 ， 它 们 有 什么 用 ? 
b) 写 一 个 程序 ， 打 印 出 所 有 的 命令 行 参数 . 














9-14. 记录 结果 修改 你 的 计算 器 程序 (练习 5-6 ) 使 之 接受 命令 行 参数 .例如 : 

$ calc. py 1 + 2 

只 输出 计算 结果 . 另外， 把 每 个 表达 式 和 它 的 结果 写 入 到 一 个 磁盘 文件 中 .， 当 使 用 下 面 的 命令 
时 : 

$ calc py print 
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会 把 记录 的 内 容 显 示 到 屏幕 上 ， 然 后 重 置 文件 ， 这 里 是 样 例 展示 : 








5 cale py 1 + 2 
a 

$ calc. py 3 3 
27 

$ calc. py print 
1*2 

2 

了 3 

27 

$ calc. py print 
$ 


附加 题 : 处 理 输入 时 候 的 注释 . 








9-15. 复制 文件 ， 提 示 输 入 两 个 文件 名 (或 者 使 用 命令 行 参数 )， 把 第 一 个 文件 的 内 容 复 人 
到 第 二 个 文件 中 去 . 





i 

















文件 中 查找 长 度 大 于 80 个 字符 的 文本 行 ， 从 最 接近 80 个 字符 的 单词 断 行 ， 把 剩余 文件 插入 到 
下 一 行 处 . 
程序 执行 完毕 后 ， 应 该 没有 超过 80 个 字符 的 文本 行 了 . 





9-16. ”文本 处 理 . 人 们 输入 的 文字 常常 超过 屏幕 的 最 大 宽度 .编写 一 个 程序 ， 在 一 个 文本 





9-17. 文本 处 理 . 创建 一 个 原始 的 文本 文件 编辑 器 . 你 的 程序 应 该 是 菜单 驱动 的 ， 有 如 下 
这 些 选 项 : 

D 创建 文件 (提示 输入 文件 名 和 任意 行 的 文本 输入 )， 

2) 显示 文件 (把 文件 的 内 容 显 示 到 屏幕 )， 

3) 编辑 文件 (提示 输入 要 修改 的 行 ， 然 后 让 用 户 进 行 修改 )， 

4) 保存 文件 ， 以 及 

5) 退出 . 


























9-18. RRX. 提示 输入 一 个 字 节 值 (0 - 255) 和 一 个 文件 名 ， 显示 该 字符 在 文件 中 出 现 
的 次 数 . 











9-19. ”创建 文件 .创建 前 一 个 问题 的 辅助 程序 .创建 一 个 随机 字 节 的 三 进 制 数 据 文件 ， 但 
某 一 特定 字 节 会 在 文件 中 出 现 指 定 的 次 数 . 该 程序 接受 三 个 参数 : 

1) 一 个 字 节 值 ( 0 - 255 ), 

2) 该 字符 在 数据 文件 中 出 现 的 次 数 ， 以 及 

3) 数据 文件 的 总 字 节 长 度 . 
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你 的 工作 就 是 生成 这 个 文件 ， 把 给 定 的 字 节 随机 散布 在 文件 里 ， 并 且 要 求 保证 给 定 字符 在 文件 
中 只 出 现 指定 的 次 数 ， 文 件 应 精确 地 达到 要 求 的 长 度 . 























9-20. 压缩 文件 ， 写 一 小 段 代 码 ， 压 缩 / 解 压缩 gzip 或 bzip 格式 的 文件 ， 可 以 使 用 命令 
47 FAY gzip 或 bzip2 以 及 GUI 程序 PowerArchiver, StuffIt, BK WinZip 来 确认 你 的 Python 
支持 这 两 个 库 . 








9-21. ZIP 归档 文件 .创建 一 个 程序 ， 可 以 往 ZIP 归档 文件 加 入 文件 ， 或 从 中 提取 文件 ， 
有 可 能 的 话 ， 加 入 创建 ZIP 归档 文件 的 功能 . 








9-22. ZIP 归档 文件 ， unzip -1 命令 显示 出 的 ZIP 归档 文件 很 无 趣 . 创建 一 个 Python 

脚本 lszip.py ， 使 它 可 以 显示 额外 信息 : 压缩 文件 大 小 ， 每 个 文件 的 压缩 比率 (通过 比较 压缩 
前 后 文件 大 小 )， 以 及 完成 的 time. ctime O WAR, MPERA HHA HH:MM . 

提示 : 归档 文件 的 date time 属性 并 不 完整 ， 无 法 提供 给 time. mktime () EH... .这 由 你 自 
己 决 定 . 





























9-23. TAR 归档 文件 .为 TAR 归档 文件 建立 类 似 上 个 问题 的 程序 .， 这 两 种 文件 的 不 同 之 处 
在 于 ZIP 文件 通常 是 压缩 的 ， 而 TAR 文件 不 是 ， 只 是 在 gzip 和 bzip2 的 支持 下 才能 完成 压缩 
工作 . 加 入 任意 一 种 压缩 格式 支持 . 


附加 题 : 同时 支持 gzip 和 bzip2 . 

9-24. 归档 文件 转换 . 参考 前 两 个 问题 的 解决 方案 ， 写 一 个 程序 ， 在 ZIP (zip 和 
TAR/gzip (. tgz/. tar. gz) 或 TAR/bzip2 (. tbz/. tar.bz2) 归档 文件 间 移 动 文 件 ， 文件 可 能 是 已 经 
存在 的 ， 必 要 时 请 创建 文件 . 

















9-25. 通用 解压 程序 .创建 一 个 程序 ， 接 受 任意 数目 的 归档 文件 以 及 一 个 目标 目录 做 为 参数 . 
归档 文件 格式 可 以 是 .zip, .tgz, .tar.gz, .gz, .bz2, .tar.bz2, . tbz 中 的 一 种 或 几 种 .程序 
会 把 第 一 个 归档 文件 解压 后 放 入 目标 目录 ， 把 其 它 归 档 文 件 解压 后 放 入 以 对 应 文件 名 命名 的 目录 下 
(不 包括 扩展 名 ). 例如 输入 的 文件 名 为 header. txt. gz 和 data.tgz ， 目 录 为 incoming , 
header. txt 会 被 解压 到 incoming 而 data. tez 中 的 文件 会 被 放 入 incoming/data . 
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Chapter 1 () 


程序 员 的 一 生 中 ， 错 误 几 乎 每 天 都 在 发 生 ， 在 过 去 的 一 个 时 期 ， 错 误 要 么 对 程序 (可 能 还 有 机 
器 ) 是 致命 的 ， 要 么 产生 一 大 堆 无 意义 的 输出 ， 无 法 被 其 他 计算 机 或 程序 识别 ， 连 程序 远 自 己 也 可 
能 搞 不 懂 它 的 意义 .一旦 出 现 错误 ， 程 序 就 会 终止 执行 ， 直 到 错误 被 修正 ， 程 序 重新 执行 。 所以， 
人 们 需要 一 个 “柔和 ”的 处 理 错 误 的 方法 ， 而 不 是 终止 程序 ， 同 时 ， 程 序 本 和 刁 也 在 不 断 发 展 ， 并 不 是 
每 个 错误 都 是 致命 的 ， 即 使 错误 发 生 ， 编 译 器 或 是 在 执行 中 的 程序 也 可 以 提供 更 多 更 有 用 的 诊断 . 







































































信息 ， 帮 助 程序 员 尽 快 解决 问题 然而， 错误 毕竟 是 错误 ， 一 般 都 是 停止 编译 或 执行 后 才能 去 解 
决 它 .一 小 段 代码 只 能 让 程序 终止 执行 ， 也 许 还 能 打印 出 一 些 模糊 的 提示 . 当然， 这 一 切 都 是 在 
异常 和 异常 处 理 出 现 之 前 的 事 了 . 




















im. 





























虽然 目前 还 没有 讨论 到 Python 中 的 类 和 面向 对 象 编程 (00P)， 但 我 们 这 里 要 介绍 的 许多 概念 
己 经 涉及 了 类 和 类 实例 . [脚注 1] 我 们 提供 了 一 小 节 介 绍 如 何 创建 自 定义 的 异常 类 . 
































1. 从 Python 1.5 开始 ， 所 有 的 标准 异常 都 使 用 类 来 实现 .如 果 你 对 类 ， 实 例 ， 以 及 其 他 面 
向 对 象 相 关 术 语 不 太 了 解 ， 请 参阅 第 13 章 

















in, SR ASAE, DLR Python 对 异常 的 支持 ， 我 们 还 会 介绍 如 何在 代码 里 
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在 深入 介绍 异常 之 前 ， 我 们 来 看 看 什么 是 错误 . 从 软件 方面 来 说 ， 错 误 是 语法 或 是 逻辑 上 的 . 
语法 错误 指示 软件 的 结构 上 有 错误 ， 导 致 不 能 被 解释 器 解释 或 编译 器 无 法 编译 . 这些 错误 必须 在 程 
序 执行 前 纠正 . 





10.1.1 错误 
































当 程序 的 语法 正确 后 ， 剩 下 的 就 是 逻辑 错误 了 .人 逻辑 错误 可 能 是 由 于 不 完整 或 是 不 合法 的 输入 
所 致 ; 在 其 他 情况 下 ， 还 可 能 是 逻辑 无 法 生成 ， 计 算 ， 或 是 输出 结果 需要 的 过 程 无 法 执行 这些 错 
误 通常 分 别 被 称 为 域 错误 和 范围 错误 . 









































当 Python 检测 到 一 个 错误 时 ， 解 释 器 就 会 指出 当前 流 已 经 无 法 继续 执行 下 去 ， 这 时 候 就 出 现 


IU. 


10.1.2 异常 











对 异常 的 最 好 描述 是 : 它 是 因为 程序 出 现 了 错误 而 在 正常 控制 流 以 外 采取 的 行为 ， 这 个 行为 又 
分 为 两 个 阶段 : 首先 是 引起 异常 发 生 的 错误 ， 然 后 是 检测 (和 采取 可 能 的 措施 ) 阶段 . 








第 一 个 阶段 是 在 发 生 了 一 个 异常 条 件 ( 有 时 候 也 叫做 例外 的 条 件 ) 后 发 生 的 ， 只 要 检测 到 错误 
并 且 意 识 到 异常 条 件 ， 解 释 器 会 引发 一 个 异常 .引发 也 可 以 叫做 触发 ， 引 发 或 者 生成 .解释 器 通 
过 它 通知 当前 控制 流 有 错误 发 生 . Python 也 人 允许 程序 员 自 己 引发 异常 ， 无 论 是 Python 解释 器 还 是 
程序 员 引 发 的 ， 异 第 就 是 错误 发 生 的 信和 号， 当前 流 将 被 打 断 ， 用 来 处 理 这 个 错误 并 采取 相应 的 操作 ， 
这 就 是 第 二 阶段 . 


















































对 异常 的 处 理发 生 在 第 二 阶段 ， 有 异常 引发 后 ， 可 以 调用 很 多 不 同 的 操作 .可 以 是 忽略 错误 ( 记 
录 错 误 但 不 采取 任何 措施 ， 采 取 补 救 措 施 后 终止 程序 )， 或 是 减轻 问题 的 影响 后 设法 继续 执行 程序 . 
所 有 的 这 些 操作 都 代表 一 种 继续 ， 或 是 控制 的 分 支 .关键 是 程序 员 在 错误 发 生 时 可 以 指示 程序 如 何 
执行 . 


























你 可 能 已 经 得 出 这 样 一 个 结论 : 程序 运行 时 发 生 的 错误 主要 是 由 于 外 部 原因 引起 的 ， 例 如 非法 
输入 或 是 其 他 操作 失败 等 等 ， 这 些 因 素 并 不 在 程序 员 的 直接 控制 下 ， 而 程序 员 只 能 预见 一 部 分 错误 ， 
编写 常见 的 补救 措施 代码 . 























类 似 Python 这 样 支 持 引 发 和 处 理 异 常 ( 这 更 重要 ) 的 语言 ， 可 以 让 开发 人 员 可 以 在 错误 发 生 时 
更 直接 地 控制 它们 . 程序 员 不 仅仅 有 了 检测 错误 的 能 力 ， 还 可 以 在 它们 发 生 时 采取 更 可 靠 的 补救 措 
施 ， 由 于 有 了 运行 时 管理 错误 的 能 力 ， 应 用 程序 的 健壮 性 有 了 很 大 的 提高 . 









































Dd n 
ABUS 
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理 并 不 是 什么 新 概念 . 它们 同样 存在 于 Ada Modula-3, C++, Eiffel, WR Java 
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， 异 常 的 起 源 可 以 追溯 到 处 理 系统 错误 和 硬件 中 断 这 类 异常 的 操作 系统 代码 .在 1965 FEA, 
PL/1 作为 第 一 个 支持 异常 的 主要 语言 出 现 ， 而 异常 处 理 是 作为 一 个 它 提供 的 软件 工具 ， 和 其 他 支 
持 异常 处 理 的 语言 类 似 ，Python 采用 了 “try/ 尝 试 ” 块 和 “catching/ 捕 获 ” 块 的 概念 ， 而 且 它 在 
异常 处 理 方面 更 有 “纪律 性 “， 我 们 可 以 为 不 同 的 异常 创建 不 同 的 处 理 器 ， 而 不 是 盲目 地 创建 一 个 
“catch-al1/ 捕 获 所 有 “的 代码 . 

























































































10.2 Python 中 的 异常 














在 先前 的 一 些 章节 里 你 已 经 执行 了 一 些 代 码 ， 你 一 定 遇 到 了 程序 ” 崩 演 “或 因 未 解决 的 错误 而 终 
止 的 情况 .你 会 看 到 “traceback/ 跟 踪 返 回 " 消 息 ， 以 及 随后 解释 器 向 你 提供 的 信息 ， 包 括 错误 的 名 
称 ， 原 因 ， 以 及 发 生 错 误 的 行 号 ， 不 管 你 是 通过 Python 解释 器 执行 还 是 标准 的 脚本 执行 ， 所 有 的 
错误 都 符合 相似 的 格式 ， 这 提供 了 一 个 一 致 的 错误 接口 ， 所 有 错误 ， 无 论 是 语意 上 的 还 是 逻辑 上 的 ， 
都 是 由 于 和 Python 解释 器 不 相 容 导致 的 ， 其 后 果 就 是 引发 异常 . 






































我 们 来 看 几 个 异常 的 例子 . 
NameError: 尝试 访问 一 个 未 申明 的 变量 
225^ foo 


Traceback (innermost last): File ^X«stdim^^, line 1, in ? 
NameError: name ’ foo? is not defined 


NameBrror 表示 我 们 访问 了 一 个 没有 初始 化 的 变量 ， 在 Python 解释 器 的 符号 表 没有 找到 那个 
另 人 讨厌 的 变量 ， 我 们 将 在 后 面 的 两 章 讨 论 名 称 空间 ， 现 在 大 家 可 以 认为 它们 是 连接 名 字 和 对 象 的 
“地 址 短 “ 就 可 以 了 ， 任 何 可 访问 的 变量 必须 在 名 称 空间 里 列 出 ， 访 问 变量 需要 由 解释 器 进行 搜索 ， 
如 果 请 求 的 名 字 没 有 在 任何 名 称 空间 里 找到 ， 那 么 将 会 生成 一 个 NameError 异常 



































ZeroDivisionError: ”除数 为 零 


2 1/0 
Traceback (innermost last): File “<stdin>”, line 1, in ? 


ZeroDivisionError: integer division or modulo by zero 


我 们 边 的 例子 使 用 的 是 整数 ， 但 事实 上 ， 任 何 数值 被 零 除 都 会 导致 一 个 ZeroDivisionError 


ak 





3m 


SyntaxError: Python 解释 器 语法 错误 


25^ for 
File “<string>”, line 1 





$— E 
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for 


SyntaxError: invalid syntax 











SyntaxError 异常 是 唯一 不 是 在 运行 时 发 生 的 异常 ， 它 代表 Python 代码 中 有 一 个 不 正确 的 结 
构 ， 在 它 改 正之 前 程序 无 法 执行 。 这些 错误 一 般 都 是 在 编译 时 发 生 ，Python 解释 器 无 法 把 你 的 脚本 
转化 为 Python 字 节 代码 .当然 这 也 可 能 是 你 导入 一 个 有 缺陷 的 模块 的 时 候 . 

















IndexError :请 求 的 索引 超出 序列 范围 

DS alist = [] 

2» alist [0] 

Traceback (innermost last): File “<stdin>”, line 1, in ? 


IndexError: list index out of range 


IndexError 在 你 尝试 使 用 一 个 超出 范围 的 值 索引 序列 时 引发 . 





KeyError :请求 一 个 不 存在 的 字典 关键 字 


2) abict = [l host’: ‘earth’, “port’: 80j 
2» print aDictí['server'] Traceback (innermost last): 
File ^«stdin^/^, line 1, in ? KeyError: server 














映射 对 象 ， 例 如 字典 ， 是 依靠 关键 字 (keys) 访问 数据 值 的 ， 如 果 使 用 错误 的 或 是 不 存在 的 键 请 


fE 
求 字 典 就 会 引发 一 个 KeyError 异常 . 





IOError: ”输入 /输出 错误 

2» f = open(blah^) Traceback (innermost last): 
File &stdin^/^, line L in ? 

T0Error: [Errno 2] No such file or directory: 'blah' 


ASMA AFT FE P PEE GE SCE 2S B ER TE E I BE ae A / 4a CL/0) X. TE 
何 类 型 的 1/0 错误 都 会 引发 IOError 异常 . 


AttributeError: 尝试 访问 未 知 的 对 象 属性 
222 class myClass (object): 


pass 





> myInst = myClass () 
2» myInst. bar = ’ spam’ 
225^ myinst. bar 
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’ spam’ 
225^ myinst. foo 
Traceback (innermost last): File “<stdin>”, line 1, in ? 


AttributeError: foo 





在 我 们 的 例子 中 ， 我 们 在 myInst. bar 储存 了 一 个 值 ， 也 就 是 实例 myInst 的 bar 属性 . 属 
性 被 定义 后 ， 我 们 可 以 使 用 就 悉 的 点 /属性 操作 符 访 问 它 ， 但 如 果 是 没有 定义 属性 ， 例 如 我 们 访问 
foo 属性 ， 将 导致 一 个 AttributeError 异常 . 























10. 3 检测 和 处 理 异常 


异常 可 以 通过 try 语句 来 检测 .任何 在 try 语句 块 里 的 代码 都 会 被 监测 ， 检 查 有 无 异常 发 
Æ. 





try 语句 有 两 种 主要 形式 : try-except 和 try-finally .这 两 个 语句 是 互 斥 的 ， 也 就 是 说 你 
只 能 使 用 其 中 的 一 种 . 一 个 try 语句 可 以 对 应 一 个 或 多 个 except 子 句 ， 但 只 能 对 应 一 个 
finally 子 句 ， 或 是 一 个 try-except-finally 复合 语句 . 


























有 探测 到 异常 的 时 执行 的 代码 ， 而 try-finally 只 人 允许 检测 异常 并 做 一 些 必要 的 清除 工作 (无 论 
发 生 错误 与 否 )， 没 有 任何 异常 处 理 设 施 ， 正 如 你 想像 的 , 复合 语句 两 者 都 可 以 做 到 . 








你 可 以 使 用 try-except 语句 检测 和 处 理 异 常 ， 你 也 可 以 添加 一 个 可 选 的 else 子 句 处 理 没 





10.3.1 try-except 语句 





try-except 语句 (以 及 其 更 复杂 的 形式 ) 定义 了 进行 异常 监控 的 一 段 代码 ， 并 且 提 供 了 处 理 异 
常 的 机 制 |. 








最 常见 的 try-except 语句 语法 如 下 所 示 . 它 由 try HA except 块 (try suite 和 
except suite ) 组 成 ， 也 可 以 有 一 个 可 选 的 错误 原因 . 








try: 

try suite # watch for exceptions here FEX EHF 
except Exception[, reason/: 

except suite | f exception-handling code  JPUAMBEEÍ(R 


我 们 用 一 个 例子 说 明 这 一 切 是 如 何 工 作 的 ， 我们 将 使 用 上 边 的 IOError 例子 ， 把 我 们 的 代码 
封装 在 try-except 里 ， 让 代码 更 健壮 : 





$— BE 
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225 fry: 
f = open( blah’, ’r’) 
. except JOError, e: 
print ‘could not open file:’, e 


could not open file: [Errno 2] No such file or directory 








如 你 所 见 ， 我 们 的 代码 运行 时 似乎 没有 遇 到 任何 错误 ， 事 实 上 我 们 在 尝试 打开 一 个 不 存在 的 文 
件 时 仍然 发 生 了 IOError . 有 什么 区 别 么 ? 我 们 加 入 了 探测 和 错误 错误 的 代码 . 当 引 发 IOError 
异常 时 ， 我 们 告诉 解释 器 让 它 打 印 出 一 条 诊断 信息 .程序 继续 执行 ， 而 不 像 以 前 的 例子 那样 被 * 麦 
出 来 ”- 异常 处 理 小 小 地 显 了 下 身手 .那么 在 代码 方面 发 生 了 什么 呢 ? 





























在 程序 运行 时 ， 解 释 器 尝试 执行 try 块 里 的 所 有 代码 ， 如 果 代码 块 完成 后 没有 异常 发 生 ， 执 
{THA GMS except 语句 继续 执行 ， 而 当 except 语句 所 指定 的 异常 发 生 后 ， 我 们 保存 了 错误 的 
原因 ， 控 制 流 立即 跳 转 到 对 应 的 处 理 器 ( try 子 句 的 剩余 语句 将 被 忽略 )， 本 例 中 我 们 显示 出 一 个 包 


含 错误 原因 的 错误 信息 . 

































































在 我 们 上 边 的 例子 中 ， 我 们 只 捕获 IOError 异常 ， 任 何其 他 异常 不 会 被 我 们 指定 的 处 理 器 捕 
3k. 举例 说 ， 如 果 你 要 捕获 一 个 OSError ， 你 必须 加 入 一 个 特定 的 异常 处 理 器 .我 们 将 在 本 章 后 
面 详细 地 介绍 try-except 语法 . 






































核心 笔记 : 忽略 代码 ， 继 续 执行 ， 和 向 上 移交 
try 语句 块 中 异常 发 生 点 后 的 剩余 语句 永远 不 会 到 达 ( 所 以 也 永远 不 会 执行 )， 一 旦 一 个 异常 被 





引发 ， 就 必须 决定 控制 流下 一 步 到 达 的 位 置 .剩余 代码 将 被 忽略 ， 解 释 器 将 搜索 处 理 器 ， 一 旦 找到 ， 


就 开始 执行 处 理 器 中 的 代码 . 

如 果 没 有 找到 合适 的 处 理 器 ， 那 么 异常 就 向 上 移交 给 调用 者 去 处 理 ， 这 意味 着 堆栈 框架 立即 回 
到 之 前 的 那个 .如 果 在 上 层 调用 者 也 没 找 到 对 应 处 理 器 ， 该 异常 会 继续 被 向 上 移交 ， 直 到 找到 合适 
处 理 器 . 如果 到 达 最 顶层 仍然 没有 找到 对 应 处 理 器 ， 那 么 就 认为 这 个 异常 是 未 处 理 的 ,Python 解释 
器 会 显示 出 跟踪 返回 消息 ， 然 后 退出 . 


10. 3.2 封装 内 建 函数 








我 们 现在 给 出 一 个 交互 操作 的 例子 - 从 最 基本 的 错误 检测 开始 ， 然 后 逐步 改进 它 ， 增 强 代 码 
的 健壮 性 ， 这 里 的 问题 是 把 一 个 用 字符 串 表 示 的 数值 转换 为 正确 的 数值 表示 形式 ， 而 且 在 过 程 中 要 
检测 并 处 理 可 能 的 错误 . 





























floatQ 内 建 函 数 的 基本 作用 是 把 任意 一 个 数值 类 型 转换 为 一 个 浮 点 数 .， 从 Python 1.5 开始 ， 
floatO 增加 了 把 字符 串 表 示 的 数值 转换 为 浮 点 数 的 功能 ， 没 必要 使 用 string 模块 中 的 atofO 
函数 .如 果 你 使 用 的 老 版 本 的 Python, WH string.atofO 替换 这 里 的 floatO . 
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2M» float (12345) 
12345. 0 

225» float ( 12345") 
12345. 0 

22» float ( 123. 45e67’ ) 
1. 2345041069 








不 幸 的 是 ，float () 对 输入 很 挑剔 : 


2> float ( foo’) 

Traceback (innermost last): File “<stdin>”, line l, in ? 
float ( foo’) 

ValueError: invalid literal for float(): foo 

225 

2» float(['this is’, 1, 'list'[) Traceback (innermost last): 
File “stdin, line L in ? 

float ([’ this is’, I, 'list'[) 


TypeError: float() argument must be a string or a number 

















从 上 面 的 错误 我 们 可 以 看 出 ，float () 对 不 合法 的 参数 很 不 客气 ， 例 如 ， 如 果 参 数 的 类 型 正确 
(字符 串 )， 但 值 不 可 转换 为 浮 点 数 ， 那 么 将 引发 ValueError 异常 ， 因 为 这 是 值 的 错误 ， 列 表 也 
是 不 合法 的 参数 ， 因 为 他 的 类 型 不 正确 ， 所 以 ， 引 发 一 个 TypeError 异常 


























我 们 的 目标 是 “安全 地 “调用 floatO 函数 ， 或 是 使 用 一 个 “安全 的 方式 ”忽略 挥 错误 ， 因 为 它 
们 与 我 们 转换 数值 类 型 的 目标 没有 任何 联系 ， 而 且 这 些 错误 也 没有 严重 到 要 让 解释 器 终止 执行 ,为 
了 实现 我 们 的 目的 ， 这 里 我 们 创建 了 一 个 封装” 函数， 在 try-except 的 协助 下 创建 我 们 预想 的 环 
境 ， 我 们 把 他 叫做 safe floatO . 在 第 一 次 改进 中 我 们 搜索 并 忽略 ValueError ， 因 为 这 是 最 党 
发 生 的 ， 而 TypeError 并 不 常见 ， 我 们 一 般 不 会 把 非 字 符 串 数据 传递 给 floatO. 




















def safe float (obj): 
try: 
return float (obj) 
except ValueError: 


pass 


我 们 采取 的 第 一 步 只 是 ”止血 “. Ze bmp, FRR AS FE”. fuU, FRA 
被 探测 到 ， 而 我 们 在 except 从 人 句 里 没有 放任 何 东西 (除了 一 个 pass ， 这 是 为 了 语法 上 的 需要 . ) 
不 进行 任何 处 理 ， 忽 略 这 个 错误 . 

















~ 








$— 一 * 一 
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这 个 解决 方法 有 一 个 明显 的 不 足 ， 它 在 出 现 错 误 的 时 候 没 有 明确 地 返回 任何 信息 虽然 返回 了 
None ( 当 函 数 没 有 显 式 地 返回 一 个 值 时 ， 例 如 没有 执行 到 return object 语句 函数 就 结束 了 ， 它 就 
返回 None)， 我 们 并 没有 得 到 任何 关于 出 错 信息 的 提示 .我们 至 少 应 该 显 式 地 返回 None ， 来 使 代 
码 更 容易 理解 : 









































def safe float (obj): 
try: 
retval - float (obj) 
except ValueError: 
retval - None 


return retval 











注意 我 们 刚才 做 的 修改 ， 我 们 只 是 添加 了 一 个 局 部 变量 .在 设计 良好 的 应 用 程序 接口 
(Application Programmer Interface，API) 时 ， 返 回 值 可 以 更 灵活 .你 可 以 在 文档 中 这 样 号 ， 如 果 
传递 给 safe float 0 合适 的 参数 ， 它 将 返回 一 个 浮 点 数 ; 如 果 出 现 错误 ， 将 返回 一 个 字符 串 说 明 
输入 数据 有 什么 问题 .我们 按照 这 个 方案 再 修改 一 次 代码 ， 如 下 所 示 : 


def safe float (obj): 
CLV. 
retval = float (obj) 
except ValueError: 
retval = 'could not convert non-number to float’ 
return retval 


这 里 我 们 只 是 把 None 蔡 换 为 一 个 错误 字符 串 ， 下 面 我们 试 试 这 个 函数 看 看 它 表 现 如 何 : 


229 safe float( 12. 34") 
12. 94 
>»» safe float( bad input’) 


'could not convert non-number to float’ 


我 们 有 了 一 个 好 的 开始 - 现在 我 们 已 经 可 以 探测 到 非法 的 字符 串 输入 了 ， 可 如 果 传 递 的 是 一 
个 非法 的 对 象 ， 还 是 会 “受伤 ”: 





2» safe float({’a’: 'Dict']) 
Traceback (innermost last): 
File “<stdin>”, line 3, in? 
retval = float (obj) 


TypeError: float() argument must be a string or a number 





$— 一 * 一 
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我 们 暂时 只 是 指出 这 个 缺点 ， 在 进一步 改进 程序 之 前 ， 首 先 来 看 看 try-except 的 其 他 灵活 的 
语法 ， 特 别 是 except 语句 ， 它 有 好 几 种 变化 形式 . 

















10.3.3 WALA except 的 try 语句 


在 本 章 的 前 边 ， 我 们 已 经 介绍 了 except 的 基本 语法 : 


except Exception[, reasonj: 
suite for exception Exception 








这 种 格式 的 except 语句 指定 检测 名 为 Exception 的 异常 ， 你 可 以 把 多 个 except 语句 连接 
在 一 起 ， 处 理 一 个 try 块 中 可 能 发 生 的 多 种 异常 ， 如 下 所 示 : 





except Exceptionl[, reasonlj: 
suite for exception Exceptioni 
except ExceptionZ[, reason2/: 
suite for exception Exception? 


同样 ， 首 先 尝 试 执行 try 子 句 ， 如 果 没 有 错误 ， 忽 略 所 有 的 except 从 句 继续 执行 . 如 果 
发 生 异 常 ， 解 释 器 将 在 这 一 串 处 理 器 (except TA) 中 查找 匹配 的 异常 ， 如 果 找 到 对 应 的 处 理 器 ， 
执行 流 将 跳 转 到 这 里 . 
































我 们 的 safe floatO 函数 已 经 可 以 检测 到 指定 的 异常 了 .更 聪明 的 代码 能 够 处 理 好 每 一 种 异 
常 ， 这 就 需要 多 个 except 语句 ， 每 个 except 语句 对 应 一 种 异常 类 型 ,Python 支持 把 except if 
句 串 连 使 用 我 们 将 分 别 为 每 个 异常 类 型 分 别 创建 对 应 的 错误 信息 ， 用 户 可 以 得 到 更 详细 的 关于 错 
误 的 信息 : 























def safe float (obj): 
try. 
retval = float (obj) 
except ValueError: 
retval = 'could not convert non-number to float’ 
except TypeError: 
retval = 'object type cannot be converted to float’ 


return retval 





使 用 错误 的 参数 调用 这 个 函数 ， 我 们 得 到 下 面 的 输出 结果 : 





$— 一 * 一 











Edit By Vheavens 


Edit By Vheavens 


ee 
T | 


2» safe float ( xyz’) 

"could not convert non-number to float’ 
2» safe float (0) 

'argument must be a string. 

ASS safe float (200L) 

200. 0 

225» safe float (45. 67000) 

45. 67 





10.3.4 处 理 多 个 异常 的 except 语句 























我 们 还 可 以 在 一 个 except 子 句 里 处 理 多 个 异常 ，except 语句 在 处 理 多 个 异常 时 要 求 异 常 被 放 
在 一 个 元 组 里 : 








except (Exceptionl, Exception2)/, reason]: 
suite for Exception] and Exception? 






































上 边 的 语法 展示 了 如 何 处 理 同时 处 理 两 个 异常 ， 事 实 上 except 语句 可 以 处 理 任 意 多 个 异常 ， 
前 提 只 是 它们 被 放 入 一 个 元 组 里 ， 如 下 所 示 : 


except (Exclí, Exc2[, ... ExcN/])[, reason]: 
suite for exceptions Excl to ExcN 








如 果 由 于 其 他 原因 ， 也 许 是 内 存 规定 或 是 设计 方面 的 因素 ， 要 求 safe floatO 函数 中 的 所 有 
异常 必须 使 用 同样 的 代码 处 理 ， 那 么 我 们 可 以 这 样 满足 需求 : 














def safe float (obj): 
try. 
retval = float (obj) 
except (ValueError, TypeError): 
retval = ’argument must be a number or numeric string’ 


return retval 


m 





现在 ， 错 误 的 输入 会 返回 相同 的 字符 串 : 


2» safe float( Spanish Inquisition’) 
'argument must be a number or numeric string’ 
22^ safe float (| [) 
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'argument must be a number or numeric string’ 
2 safe float L6) 

1.6 

2»? safe float (1. 6) 

1.6 

2» safe float (932) 

932. 0 





10. 3. 5 捕获 所 有 蜡 常 














使 用 前 一 节 的 代码 ， 我 们 可 以 捕获 任意 数目 的 指定 异常 ， 然 后 处 理 它们 . 如 果 我 们 想 要 捕获 所 
有 的 异常 昵 ? 当然 可 以 ! 自 版 本 1.5 后 ， 异 常 成 为 类 ， 实 现 这 个 功能 的 代码 有 了 很 大 的 改进 .也 
因为 这 点 (异常 成 为 类 ), 我 们 现在 有 一 个 异常 继承 结构 可 以 遵循 . 

















如 果 查 询 异常 继承 的 树 结构 ， 我 们 会 发 现 Exception 是 在 最 顶层 的 ， 所 以 我 们 的 代码 可 能 
起 来 会 是 这 样 : 


try. 


except Exception, e: . 
# error occurred, log 'e', etc. 


另 一 个 我 们 不 太 推 荐 的 方法 是 使 用 裸 except FA): 








try: 


except: 
Z error occurred, etc. 








这 个 语法 不 如 前 个 “Pythonic”. 虽然 这 样 的 代码 捕获 大 多 异常 ， 但 它 不 是 好 的 Python 编程 
样式 ， 一 个 主要 原因 是 它 不 会 考虑 潜在 的 会 导致 异常 的 主要 原因 .我 们 的 catch-all 语句 可 能 不 
会 如 你 所 想 的 那样 工作 ， 它 不 会 调查 发 生 了 什么 样 的 错误 ， 如 何 避 人 免 它们 . 


























我 们 没有 指定 任何 要 捕获 的 异常 - 这 不 会 给 我 们 任何 关于 可 能 发 生 的 错误 的 信息 ， 另 外 它 会 
捕获 所 有 异常 ， 你 可 能 会 忽 咯 掉 重要 的 错误 ， 正 常情 况 下 这 些 错误 应 该 让 调用 者 知道 并 做 一 定 处 理 
最 后 ， 我 们 没有 机 会 保存 异常 发 生 的 原因 ， 当 然 ， 你 可 以 通过 sys. exc infoO 获得 它 ， 但 这 样 你 
就 不 得 不 去 导入 sys 模块 ， 然 后 执行 函数 ~ 这 样 的 操作 本 来 是 可 以 避免 的 ， 尤 其 当 我 们 需要 立即 
告诉 用 户 为 什么 发 生 异 常 的 时 候 . 在 Python 的 未 来 版 本 中 很 可 能 不 再 支持 裸 except FA). (参见 
“核心 风格 ”) 









































$— 一 * 一 
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关于 捕获 所 有 异常 ， 你 应 当知 道 有 些 异 常 不 是 由 于 错误 条 件 引 起 的 . 它们 是 SystemExit 和 
KeyboardInterupt . SystemExit 是 由 于 当前 Python 应 用 程序 需要 退出 ，KeyboardInterupt 代表 
用 户 按 下 了 CTRL-C CO) ， 想 要 关闭 Python .在 真正 需要 的 时 候 ， 这 些 异 常 却 会 被 异常 处 理 捕获 . 
一 个 典型 的 迁 回 工作 法 代码 框架 可 能 会 是 这 样 : 





















































try: 


except (KeyboardInterupt, SystemExit): 
# user wants to quit 
raise # reraise back to caller 
except Exception: 
# handle real errors 





关于 异常 的 一 部 分 内 容 在 Python 2.5 有 了 一 些 变化 ， 异常 被 迁移 到 了 new-style class E, 
启用 了 一 个 新 的 “所 有 异常 的 母亲 “， 这 个 类 叫做 BaseException ， 异 常 的 继承 结构 有 了 少许 调整 ， 
为 了 让 人 们 摆脱 不 得 不 除 创 建 两 个 处 理 器 的 惯用 法 .KeyboardInterrupt 和 SystemExit 被 从 
Exception 里 移出 ， 和 Exception 平 级 : 

















— BaseException 
|- KeyboardInterrupt 
|- SystemExit 
|- Exception 
|- (all other current built-in exceptions) 所 有 当前 内 建 异 常 














你 可 以 在 表 10.2 找到 整个 异常 继承 结构 (变化 前 后 ). 











这 样 ， 当 你 已 经 有 了 一 个 Exception 处 理 器 后 ， 你 不 必 为 这 两 个 异常 创建 额外 的 处 理 占 ， 代 
码 将 会 是 这 样 : 





try: 


except Exception, e: 
# handle real errors 








如 果 你 确实 需要 捕获 所 有 异常 ， 那 么 你 就 得 使 用 新 的 BaseException : 

















try: 


except DaseException, e: 
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# handle all errors 





核心 风格 : 不 要 处 理 并 忽略 所 有 错误 
Python 提供 给 程序 员 的 try-except 语句 是 为 了 更 好 地 跟踪 潜在 的 错误 并 在 代码 里 准备 好 处 
理 异 常 的 逻辑 ， 这 样 的 机 制 在 其 他 语言 (例如 C ) 是 很 难 实现 的 . 它 的 目的 是 减少 程序 出 错 的 次 数 
并 在 出 错 后 仍 能 保证 程序 正常 执行 ， 作为 一 种 工具 而 言 ， 只 有 正确 得 当地 使 用 它 ， 才 能 使 其 发 挥 作 
用 . 
一 个 不 正确 的 使 用 方法 就 是 把 它 作为 一 个 大 绷带 “ 绑 定 “ 到 一 大 片 代码 上 .， 也 就 是 说 把 一 大 段 程 
Fr (如 果 还 不 是 整个 程序 源 代 码 的 话 ) 放 入 一 个 try 块 中 ， 再 用 一 个 通用 的 except 语句 “过 滤 
掉 任何 致命 的 错误 ， 忽 略 它 们 . 
# this is really bad code 
try: 
large_block_of_code # bandage of large piece of code 
except Exception: # same as except: 
pass # blind eye ignoring all errors 
很 明显 ， 错 误 无 法 避免 ， try-except 的 作用 是 提供 一 个 可 以 提示 错误 或 处 理 错误 的 机 制 ， 而 不 
是 一 个 错误 过 滤器 . 上 边 这 样 的 结构 会 忽略 许多 错误 ， 这 样 的 用 法 是 缺乏 工程 实践 的 表现 ， 我 们 


不 赞同 这 样 做 . 
底线 : 避免 把 大 片 的 代码 装 入 try-except 中 然后 使 用 pass 忽略 掉 错 误 . 你 可 以 捕获 特定 
的 异常 并 忽略 它们 ， 或 是 捕获 所 有 异常 并 采取 特定 的 动作 .不 要 捕获 所 有 异常 , 然后 忽略 掉 它们 . 


10.3.6 异常 参数 
































异常 也 可 以 有 参数 ， 有 异常 引发 后 它 会 被 传递 给 异常 处 理 器 . 当 异 常 被 引发 后 参数 是 作为 附加 帮 
助 信 息 传递 给 异常 处 理 器 的 .虽然 异常 原因 是 可 选 的 ， 但 标准 内 建 异 常 提供 至 少 一 个 参数 ， 指 示 异 
常 原因 的 一 个 字符 串 . 






















































































异常 的 参数 可 以 在 处 理 器 里 忽略 ， 但 Python 提供 了 保存 这 个 值 的 语法 . 我 们 已 经 在 上 边 接触 
到 相关 内 容 : 要 想 访问 提供 的 异常 原因 ， 你 必须 保留 一 个 变量 来 保存 这 个 参数 .把 这 个 参数 放 在 
except 语句 后 ， 接 在 要 处 理 的 异常 后 面 ，except 语句 的 这 个 语法 可 以 被 扩展 为 : 












































# single exception 
except Exception[, reason]: 
suite for Exception with Argument 


# multiple exceptions 
except (Exceptionl, Exception2, ..., ExceptionN)[, reason]: 
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suite for Exception] to ExceptionN with Argument 




















reason 将 会 是 一 个 包含 来 自 导致 异常 的 代码 的 诊断 信息 的 类 实例 .异常 参数 自身 会 组 成 一 个 
元 组 , 并 存储 为 类 实例 (异常 类 的 实例 ) 的 属性 . 上 边 的 第 一 种 用 法 中 ，reason 将 会 是 一 个 
Exception 类 的 实例 . 




















对 于 大 多 内 建 异常 ， 也 就 是 从 StandardBrror 派生 的 异常 ， 这 个 元 组 只 包含 一 个 指示 错误 原 
因 的 字符 串 ， 一 般 说 来 ， 蜡 常 的 名 字 已 经 是 一 个 满意 的 线索 了 ， 但 这 个 错误 字符 串 会 提供 更 多 的 信 
息 ， 操 作 系统 或 其 他 环境 类 型 的 错误 ， 例 如 IOError ， 元 组 中 会 把 操作 系统 的 错误 编号 放 在 错误 字 
符 串 前 . 















































无 论 reason 只 包含 一 个 字符 串 或 是 由 错误 编号 和 字符 串 组 成 的 元 组 ， 调 用 str(reason) 总 
会 返回 一 个 良好 可 读 的 错误 原因 . 不 要 忘记 reason 是 一 个 类 实例 - 这 样 做 你 其 实 是 调用 类 的 特 
殊 方 法 str () . 我们 将 在 第 13 章 探 索 面 向 对 象 编程 中 的 这 些 特 丈 方法 . 














唯一 的 问题 就 是 某 些 第 三 方 或 是 其 他 外 部 库 并 不 遵循 这 个 标准 协议 ， 我 们 推荐 你 在 引发 你 自己 
的 异常 时 遵循 这 个 标准 (参见 核心 风格 笔记 ). 








核心 风格 : 遵循 异常 参数 规范 

当 你 在 自己 的 代码 中 引发 内 建 (built-in) 的 异常 时 ， 尽 量 遵 循 规 范 ， 用 和 已 有 Python 代码 
一 致 错误 信息 作为 传 给 异常 的 参数 元 组 的 一 部 分 .简单 地 说 ， 如 果 你 引发 一 个 ValueError ， 那 么 
最 好 提供 和 解释 器 引发 ValueError 时 一 致 的 参数 信息 ， 如 此 类 推 . 这 样 可 以 在 保证 代码 一 致 性 ， 
同时 也 能 避免 其 他 应 用 程序 在 使 用 你 的 模块 时 发 生 错 误 . 





如 下 边 的 例子 ， 它 传 参 给 内 建 float 函数 一 个 无 效 的 对 象 ， 引 发 TypeError 异常 : 





2225 try: 
float(['float() does not’, “like lists’, 2[) 
. except TypeError, diag:# capture diagnostic info 


pass 


225» type (diag) 

<class 'exceptions. TypeError' > 

p 

255^ print diag 

float() argument must be a string or a number 


我 们 首先 在 一 个 try 语句 块 中 引发 一 个 异常 ， 随 后 简单 的 忽略 了 这 个 异常 ， 但 保留 了 错误 的 信 
A. WAAAY type 0 函数， 我 们 可 以 确认 我 们 的 异常 对 象 的 确 是 TypeError 异常 类 的 实例 。 最 后 
我 们 对 异常 诊断 参数 调用 print 以 显示 错误 。 












































$— —$— 
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为 了 获得 更 多 的 关于 异常 的 信息 , 我 们 可 以 调用 该 实例 的 class — TE, 它 标 示 了 实例 是 从 
什么 类 实例 化 而 来 . 类 对 象 也 有 属性 ， 比 如 文档 字符 串 (documentation string) 和 进一步 前 明 错 误 
类 型 的 名 称 字符 串 : 











222 diag # exception instance object 

Cexceptions. TypeError instance at 61213785 

2? diag. class . # exception class object 

<class exceptions. TypeError at 80f6d50> 

22» diag. class . doc # exception class documentation string 





2j 


'L nappropriate argument type. 


22^ diag. class . name # exception class name 





' TypeError' 





我 们 会 在 第 13 "SRA RRR” AHL, — class 属性 存在 于 所 有 的 类 实例 中 , 而 doc __ 
性 存在 于 所 有 的 定义 了 文档 字符 串 的 类 中 . 











类 


G 


H 
TH 


我 们 现在 再 次 来 改进 我 们 的 saft_float O 以 包含 异常 参数 , 当 float O 发 生 异 常 时 传 给 解释 器 . 
在 前 一 次 改进 中 , 我 们 在 一 句 话 中 同时 捕获 了 ValueError 和 TypeError 异常 以 满足 某 些 需求 . 但 还 
EARE, 那个 解决 方案 中 没有 线索 表明 是 哪 一 种 异常 引发 了 错误 . 它 仅仅 是 返回 了 一 个 错误 字符 
串 指 出 有 无 效 的 参数 . 现在 , 通过 异常 参数 , 可 以 改善 这 种 状况 . 




















因为 每 一 个 异常 都 将 生成 自己 的 异常 参数 , 如 果 我 们 选择 用 这 个 字符 串 来 而 不 是 我 们 自 定义 的 
信息 , 可 以 提供 一 个 更 好 的 线索 来 指出 问题 . 下面 的 代码 片段 中 ,我们 用 字符 串 化 string 
representation) 的 异常 参数 来 葵 换 单一 的 错误 信息 . 














def safe float (object): 
try: 
retval = float (object) 
except (ValueError, TypeError), diag: 
retval = str (diag) 
return retval 














在 此 基础 上 运行 我 们 的 新 代码 , 当 我 们 提供 sofe float O 的 参数 给 不 恰当 时 , 虽然 还 是 只 有 一 条 
捕获 语句 , 但 是 可 以 获得 如 下 (不 同 的 ) 信息 . 








22^» safe float ( xyz’) 

"invalid literal for float(): xyz’ 
2» safe float(1]) 

'object can't be converted to float’ 





$— 一 * 一 
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10.3.7 在 应 用 使 用 我 们 封装 的 函数 





我 们 将 在 一 个 迷你 应 用 中 特地 的 使 用 这 个 函数 . 它 将 打开 信用 卡 交 易 的 数据 文件 
(carddata. txt), 加 载 所 有 的 交易 , 包括 解释 的 字符 串 . 下 面 是 一 个 示例 的 carddate. txt 文件 : 





% cat carddata. txt 

# carddata. txt previous balance 

25 

debits 

21. 64 

541. 24 

25 

credits 

-25 

-541. 24 

finance charge/late fees 
7. 30 
a 


我 们 的 程序 , cardrun. py, 见 示 例 10. 1 


示例 10.1 信用 卡 交 易 系 统 (cardrun. py) 
我 们 用 safe float () 来 处 理 信 用 卡 交 易 文 件 , 将 其 作为 字符 串 读 入 . 并 用 一 个 日 志文 件 跟踪 处 理 





























进程 . 
1 "l/usr/bin/env python 
2 
3 def safe float (obj): 
4 'safe version of float ()’ 
5 try: 
6 retval = float (obj) 
jd except (ValueError, TypeError), diag: 
8 retval = str (diag) 
9 return retval 
10 
11 def main: 
12 "handles all the data processing’ 
13 log = open C cardlog. txt’, °w 


LIV. 
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15 ccfile = open (l carddata. txt’, 'r') 

16 except IOError, e: 

17 log.write( no txns this month\n’) 

18 log. close () 

19 return 

20 

21 txns = ccfile. readlines () 

22 ccfile. close () 

23 total = 0.00 

24 log. write( account log: \n’) 

25 

26 for eachTxn in txns: 

27 result = safe float (eachTxn) 

28 If isinstance(result, float): 

29 total *- result 

30 log. write( data... processed|n ) 

31 else: 

32 log. write C ignored: %s’ % result) 
33 print '$*. 2f (new balance)’ % (total) 
34 log. close O 
35 
36 if name ==’ main 

37 main () 

逐 行 解读 

行 3-9 


这 段 代 码 是 safe float O 函数 的 主体 


行 11-34 

我 们 应 用 的 核心 部 分 有 3 个 主要 任务 
(1) 读 入 信用 卡 的 数据 文件 

(2) 处 理 输入 

(3) 显示 结果 








行 14-22 

从 文件 中 提取 数据 . 你 可 以 看 到 这 里 的 文件 打开 被 置 于 try-except 语句 段 中 . 

同时 还 有 一 个 处 理 的 日 志文 件 . 在 我 们 的 例子 中 , 我 们 假设 这 个 日 志文 件 可 以 不 出 错 的 打开 . 你 
可 以 看 到 我 们 的 处 理 进程 伴随 着 这 个 日 志文 件 . 如 果 信 用 卡 的 数据 文件 不 能 够 被 访问 , 我 们 可 以 假设 











$— 一 * 一 
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该 月 没有 信用 卡 交 易 ( 行 16 - 19). 











数据 被 读 入 txns (transactions 4245) 列表 , 随后 在 26-32 行 遍 历 它 . 每 次 调用 safe float (后 ， 
我 们 用 内 建 的 isinstance 函数 检查 结果 类 型 . 在 我 们 例子 中 , 我 们 检查 safe float 是 返回 字符 串 还 
是 浮 点 数 . 任何 字符 串 都 意味 着 错误 , 表明 该 行 不 能 转换 为 数字 , 同时 所 有 的 其 他 数字 可 以 作为 浮 点 
AAA total. Æ main( 函 数 的 尾行 会 显示 最 终生 成 的 余额 . 























行 36-37 
这 两 行 通常 表明 “ 仅 在 非 导 入 时 启动 “的 功能 . 运行 我 们 程序 , 可 以 得 到 如 下 的 输出 











$ cardrun. py 
$ 58.94 (new balance) 


我 们 再 看 看 log X fF (cardlog. txt), 我们 可 以 看 到 在 处 理 完 carddata. txt 中 的 交易 后 有 其 有 如 
下 的 记录 条 目 : 











$ cat cardlog. txt 

account log: 

ignored: invalid literal for float: # carddata. txt 
ignored: invalid literal for float: previous balance 


data... processed 

ignored: invalid literal for float: debits 
data... processed 
data... processed 
data... processed 


ignored: invalid literal for float: credits 


data... processed 


10.3.8 else 子 句 


我 们 已 经 看 过 else 语句 段 配 合 其 他 的 Python 语句 , 比如 条 件 和 循环 . 至 于 try-except 1E EX, 
它 的 功能 和 你 所 见 过 的 其 他 else 没有 太 多 的 不 同 : 在 try 范围 中 没有 异常 被 检测 到 时 , 执行 else 子 
^R. 























f£ else 范围 中 的 任何 代码 运行 前 , try 范围 中 的 所 有 代码 必须 完全 成 功 (也 就 是 , 结束 前 没有 引发 
异常 ). 下 面 是 用 Python 伪 代 码 写 的 简短 例子 . 





import 3rd party module 





$— E 
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log = open( logfile. txt’, °w) 





try: 

3rd party module. function Q) 
except: 

log. write (“xxx caught exception in module|n^) 
else: 


log. write ("xxx no exceptions caught|n^) 


log. close () 














在 前 面 的 例子 中 , 我们 导入 了 一 个 外 部 的 模块 然后 测试 是 否 有 错误 . 用 一 个 日 志文 件 来 确定 这 个 
第 三 方 模块 是 有 无 缺陷. 根据 运行 时 是 否 引发 异常 , 我 们 将 在 日 志 中 写 入 不 同 的 消息 . 























10.3.9 finally 子 句 











finally 子 句 是 无 论 异 常 是 否 发 生 , 是 否 捕 捉 都 会 执行 的 一 段 代 码 . 你 可 以 将 finally 仅仅 配合 
try 一 起 使 用 , 也 可 以 和 try-except (else 也 是 可 选 的 ) 一 起 使 用 . 独立 的 try-finally 将 会 在 下 一 章 
介绍 , 我 们 稍 后 再 来 研究 . 


从 Python 2.5 开始 , 你 可 以 用 finally 子 句 (再 一 次 ) 与 try-except 或 try-except-else 一 起 
使 用 .之 所 以 说 是 ”再 一 次 ”是 因为 无 论 你 相信 与 否 , 这 并 不 是 一 个 新 的 特性 . 回顾 Python 初期 , 这 个 特 
性 在 早已 存在 , 但 是 在 Python 0.9.6(1992 四 月 ) 中 被 移 除 . 那 时 , 这 样 可 以 简化 字 节 码 的 生成 , 并 方便 
解析 , 另外 就 是 范 。 罗 萨 姆 认为 一 个 标准 化 的 try-except Celse)-finally 无 论 如 何不 会 太 流行 . 然 
而 , 十 年 时 间 改 变 了 一 切 ! 








下 面 是 try-except-else-finally 语法 的 示例 : 


try: 
A 
except MyException: B 
else: C 
finally: D 





等 价 于 Python 0.9.6 至 2.4.x 中 如 下 的 写法 : 
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except MyExcept ion: 
B 
else: C 
finally: 
D 

















finally 都 是 可 选 的 .A,B,C 和 D 是 程序 (代码 块 ). 程序 会 按 预 期 的 顺序 执行 . (注意 :可 能 的 顺序 是 
A-C-D[ 正 常 ] 或 A-B-D[ 异 常 ]) .无 论 异常 发 生 在 A,B, 和 /或 C 都 将 执行 finally 块 . 旧式 写法 依然 有 效 ， 
所 以 没有 向 后 兼容 的 问题 . 























10. 3. 10 try-finally 语句 


另 一 种 使 用 finally 的 方式 是 finally 单独 和 try 连用 . 这 个 try-finally 语句 和 try-except 
区 别 在 于 它 不 是 用 来 捕捉 异常 的 . 作为 替代 , 它 常 常用 来 维持 一 致 的 行为 而 无 论 异 常 是 否 发 生 . 我 们 
得 知 无 论 try PHBA HAM, finally 代码 段 都 会 被 执行 

















try: 
try suite 
finally: 
finally suite ZEE UAI T 


当 在 try 范围 中 产生 一 个 异常 时 ，( 这 里 ) 会 立即 跳 转 到 finally 语句 段 . 4 finally 中 的 所 有 代 
码 都 执行 完毕 后 , 会 继续 向 上 一 层 引发 异常 . 

因而 常常 看 到 骸 套 在 try-except 中 的 try-finally 语句 . 当 在 读 取 carddata. txt 中 文本 时 可 能 
引发 异常 ,我 们 可 以 在 cardrun. py 的 这 一 处 添加 try-finally 语句 段 来 改进 代码 . 在 当前 示例 10.1 
的 代码 中 , 我 们 在 读 取 阶 段 没有 探测 到 错误 (通过 readl ines 0) 


























try: 

ccfile = open( carddata. txt’) 
except lÜError: 

log.write( no txns this month\n’) 


txns = ccfile. readlines 0 
ccfile. close 0 








但 有 很 多 原因 会 导致 readlines O 失败 , 其 中 一 种 就 是 carddata. txt 存在 于 网 络 (或 软盘 ) E, 但 
是 变 得 不 能 读 取 . 无 论 怎样 , 我 们 可 以 把 这 一 小 段 读 取 数 据 的 代码 整个 放 入 try 子 句 的 范围 中 : 








E 





$— 一 * 一 











Edit By Vheavens 


ee 


T 


try. 


Edit By Vheavens 





ccfile = open( carddata. txt’, 'r') 
txns = ccfile. readlines () 
ccfile. close() 


except lÜError: 


log.write( no txns this month\n’) 





我 们 所 做 的 一 切 不 过 是 将 readline O 和 close () 方 法 调用 都 移入 了 try 语句 段 . 尽管 我 们 代码 变 
得 更 加 的 健壮 了 , 但 还 有 改进 的 空间 . 注意 如 果 按 照 这 样 的 顺序 发 生 错 误 :打开 成 功 , 但 是 出 于 一 些 原 
readlines () 调用 失败 , 异常 处 理会 去 继续 执行 except 中 的 子 句 , 而 不 去 尝试 关闭 文件 . 难道 没有 一 
种 好 的 方式 来 关闭 文件 而 无 论 错误 是 否 发 生 ? 我 们 可 以 通过 try-finally 来 实现 : 























ccfile = None 


try: 


try: 
ccfile = open (l carddata. txt’, 'r') 
txns = ccfile. readlines () 

except lÜError: 
log. write( no txns this month\n’) 


finally: 


if ccfile: 
ccfile. close 0 


代码 片段 会 尝试 打开 文件 并 且 读 取 数 据 . 如 果 在 其 中 的 某 步 发 生 一 个 错误 , 会 号 入 日 志 , 随后 文 


件 被 正 而 














的 关闭 . 如 果 没 有 错误 发 生 , 文件 也 会 被 关闭 . (同样 的 功能 可 以 通过 上 面 标准 化 的 








try-except-finally 语句 段 实 现 ). 另 一 种 可 选 的 实现 切换 了 try-except M try-finally 包含 的 方式 ， 


如 : 


ccfile = None 


try: 


try: 
ccfile = open( carddata. txt’, 'r') 
txns = ccfile. readlines () 

finally: 


if ccfile: 
ccfile. close 0 


except IOError: 





[e— 





log.write( no txns this month\n’) 
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代码 本 质 上 干 的 是 同一 种 工作 , 除了 一 些小 小 的 不 同 . 最 显著 的 是 关闭 文件 发 生 在 异常 处 理 器 将 
错误 写 入 日 志 之 前 . 这 是 因为 finally 会 自动 的 重新 引发 异常 . 














一 个 这 样 写 的 理由 是 如 果 在 finally 的 语句 块 内 发 生 了 一 个 异常 , 你 可 以 创建 一 个 同 现 有 的 异常 
处 理 器 在 同一 个 (外) 层次 的 异常 处 理 器 来 处 理 它 . 这 样 , 从 本 质 上 来 说 , 就 可 以 同时 处 理 在 原始 的 try 
语句 块 和 finally 语句 块 中 发 生 的 错误 . 这 种 方法 唯一 的 问题 是 , 当 finally 语句 块 中 的 确 发 生 异 和 
时 , 你 会 丢失 原来 异常 的 上 下 文 信息 , 除非 你 在 某 个 地 方 保存 了 它 . 






























































ak 























反对 这 种 写法 的 一 个 理由 是 :在 很 多 情况 下 , 异常 处 理 器 需要 做 一 些 扫 尾 工 作 , 而 如 果 你 在 异常 
处 理 之 前 ,用 finally 语句 块 中 释放 了 某 些 资源 , 你 就 不 能 再 去 做 这 项 工作 了 . 简单 的 说 , finally 语句 
块 并 不 是 如 你 所 想 的 是 最终 的 (final)” 了 . 














一 个 最 终 的 注意 点 :如 果 finally 中 的 代码 引发 了 另 一 个 异常 或 由 于 return, break, continue if 
法 而 终止 , 原来 的 异常 将 丢失 而 且 无 法 重新 引发 . 








10.3.11 try-except-else-finally: Bj — Matn 
我 们 综合 了 这 一 章 目 前 我 们 所 见 过 的 所 有 不 同 的 可 以 处 理 异 常 的 语法 样式 : 














try: 
try_suite 


except Exceptionl: 
suite for Exceptionl 


except (ExceptionZ, Exception3, Exception4): 
suite for Exceptions 2 3 and 4 


except Exceptionó, Argument: 
suite for Exceptionó plus argument 


except (Exception6, Exception7), Argument67: 
suite for Exceptions6 and 7 plus argument 





except: 
suite for all other exceptions 





else: 


no exceptions detected suite 


$— 一 * 一 
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finally: 


always execute suite 





回顾 上 面 的 , finally 子 句 和 try-except 或 try-except-else 联合 使 用 是 Python 2.5 的 “新 “有 
的 . 这 一 节 最 重要 的 是 无 论 你 选择 什么 语法 , 你 至 少 要 有 一 个 except FH), 而 else 和 finally 都 是 可 
选 的 . 














10.4 上 下 文 管理 
10.4.1 with 语句 


如 上 所 述 的 标准 化 的 try-except 和 try-finally 可 以 使 得 程序 更 加 ”Pythonic”, 其 含义 是 , 在 许 
多 的 其 他 特性 之 外 , 更 加 写 地 轻松 , 读 地 自在 . Python 对 隐藏 细节 已 经 做 了 大 量 的 工作 , 因此 需要 你 操 
心 的 仅 是 如 何 解决 你 所 遇 到 问题 . (你 能 假想 移植 一 个 复杂 的 Python 应 用 到 C++ 或 Java M4?! ?) 

另 一 个 隐藏 低层 次 的 抽象 的 例子 是 with 语句 , 它 在 Python 2. i (Python2. 5 尝试 性 
的 引入 了 with， 并 对 使 用 with 作为 标识 符 的 应 用 程序 发 出 这 样 的 警告 - 在 Python 2.6 中 , with 
BO MAK HS. 如果 你 想 在 Python 2.5 使 用 with 语句 ， 你 必须 用 from future import 
with statement 来 导入 它 .) 














类 似 try-except-finally, with 语句 也 是 用 来 简化 代码 的 , 这 与 用 try-except 和 try-finally 

所 想 达 到 的 目的 前 后 呼应 . try-except 和 try-finally 的 一 种 特定 的 配合 用 法 是 保证 共享 的 资源 的 

唯一 分 配 ， a usa 比如 文件 (数据 , 日 志 , 数据 库 等 等 ), 线程 资源 , 简单 同步 , 数 
据 库 连 接 , SE. with 语句 的 目标 就 是 应 用 在 这 种 场景 . 





























然而 ，with 语句 的 目的 在 于 从 流程 图 中 把 try, except 和 finally 关键 字 和 资源 分 配 释 放 相 关 
代码 统统 去 掉 ， 而 不 是 像 try-except-finally 那样 仅仅 简化 代码 使 之 易 用 . with 语法 的 基本 用 法 
看 上 去 如 下 : 





with context expr [as varj: 
With suite 








看 起 来 如 此 简单 , 但 是 其 背后 还 有 一 些 工 作 要 做 . 这 并 不 如 看 上 去 的 那么 容易 , 因为 你 不 能 对 
Python 的 任意 符号 使 用 with 语句 . 它 仅 能 工作 于 支持 上 下 文 管理 协议 (context management 
protocol) 的 对 象 . 这 显然 意味 着 只 有 内 建 了 “上 下 文 管理 的 对 象 可 以 和 with 一 起 工作 . 我 们 过 一 会 
再 来 前 明 它 的 含义 . 


















































现在 , 正如 一 个 新 的 游戏 硬件 , 每 当 有 一 个 新 的 特性 推出 时 , 第 一 时 间 总 有 人 开发 出 相应 的 新 游 
XX, 从 而 你 打开 盒子 就 可 以 开始 玩 了 . 类 似 , 目前 已 经 有 了 一 些 文 持 该 协议 的 对 象 . 下 面 是 第 一 批 成 员 
的 简短 列表 : 
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file 

decimal. Context 
thread. LockType 
threading. Lock 
threading. RLock 
threading. Condition 
threading. Semaphore 


threading. BoundedSemaphore 











既然 file 是 上 面 的 列表 上 的 第 一 个 也 是 最 易于 演示 的 , 下 面 就 给 出 一 段 和 with 一 起 使 用 的 代码 
片段 . 


with open l /etc/passwd', 'r') as f: 
for eachLine in f: 
#...do stuff with eachLine or f... 





这 个 代码 片段 干 了 什么 呢 .. . 28, 这 是 Python, 因而 你 很 可 能 的 已 经 猜 到 了 . 它 会 完成 准备 工作 ， 
比如 试图 打开 一 个 文件 , 如 果 一 切 正常 , 把 文件 对 象 赋值 给 f. 然后 用 迭代 器 所 历 文件 中 的 每 一 行 , 当 
完成 时 , 关闭 文件 . 无 论 的 在 这 一 段 代码 的 开始 , 中 间 , 还 是 结束 时 发 生 异 常 , 会 执行 清理 的 代码 , 此 


























外 文件 仍 会 被 自动 的 关闭 . 




















因为 己 经 从 你 手边 拿 走 了 一 堆 细节 ,所 以 实际 上 只 是 进行 了 两 层 处 理 : 
第 一 , 发 生 用 户 层 一 一 和 in 类 似 , 你 所 需要 关心 的 只 是 被 使 用 的 对 象 
第 二 , 在 对 象 层 . 既然 这 个 对 象 支持 上 下 文 管理 协议 , 它 干 的 也 就 是 < 上 下 文 管理 ”. 


























10.4.2 * 上 下 文 管理 协议 


除非 你 打算 自 定义 可 以 和 with 一 起 工作 的 类 , 比如 : 别 的 程序 员 会 在 他 们 的 设计 的 应 用 中 使 用 你 
的 对 象 
EKE Python 程序 员 仅仅 需要 使 用 with 语句 , 可 以 跳 过 这 一 节 





ANS 





我 们 不 打算 在 这 里 对 上 下 文 管理 做 深入 且 详 细 的 探讨 , 但 会 介绍 兼容 协议 所 必须 的 对 象 类 型 与 
功能 , 使 其 能 和 with 一 起 工作 . 




















前 面 , 我 们 在 例子 中 描述 了 一 些 关 于 协议 如 何 和 文件 对 象 协同 工作 . 让 我 们 在 此 进一步 地 研究 . 





上 下 文 表达 式 (context_expr), 上 下 文 管理 器 
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25 with 语句 执行 时 , 便 执行 上 下 文 符号 GEHE LUE with 5E as 间 内 容 ) 来 获得 一 个 上 下 文 管理 
器 . 上 下 文 管理 器 的 职责 是 提供 一 个 上 下 文 对 象 . 这 是 通过 调用 O context 0 方法 来 实现 的 . 该 方法 
返回 一 个 上 下 文 对 象 , 用 于 在 with 语句 块 中 处 理 细节 .有 点 需要 注意 的 是 上 下 文 对 象 本 和 喘 就 可 以 是 上 
下 文 管理 器 . 所 以 context_expr 既 可 以 为 一 个 真正 的 上 下 文 管理 器 , 也 可 以 是 一 个 可 以 自我 管理 的 上 
下 文 对 象 . 在 后 一 种 情况 时 , 上 下 文 对 象 仍然 有 context. 0 方法 , 返回 其 自身 , 如 你 所 想 . 

















































































































上 下 文 对 象 , with 语句 块 





一 旦 我 们 获得 了 上 下 文 对 象 , 就 会 调用 它 的 _enter 0 _ 方 法. 它 将 完成 with 语句 块 执行 前 的 所 
有 准备 工作 . 你 可 以 注意 到 在 上 面 的 with 行 的 语法 中 有 一 个 可 选 的 as 声明 变量 跟随 在 context_expr 
之 后 . 如 果 提 供 提供 了 变量 , 以 _enterO 返回 的 内 容 来 赋值 ;否则 , 丢弃 返回 值 . 在 我 们 的 文件 对 象 
例子 中 , 上 下 文 对 象 的 _enter( 返回 文件 对 象 并 赋值 给 f. 


























现在 , 执行 了 with 语句 块 . 4 with 语句 块 执行 结束 , 无 论 是 和谐 地 “还 是 由 于 异常 ,都 会 调用 上 
下 文 对 象 的 ”exit (方法. exit () 有 三 个 参数 . 如 果 with 语句 块 正 常 结束 , 三 个 参数 全 部 是 
None. 如 果 发 生 异 常 , 三 个 参数 的 值 的 分 别 等 于 调用 sys. exc_info() 函数 ( 见 10. 12) 返 回 的 三 个 值 : 类 
型 (异常 类 ) , 值 (异常 实例 ), 和 回溯 (traceback) , 相应 的 回溯 对 象 . 


























你 可 以 自己 决定 如 何在 _exit 0 里 面 处 理 异常 . 惯例 是 当 你 处 理 完 异常 时 不 返回 任何 值 ,或 
返回 None, 或 返回 其 他 布尔 值 为 False 对 象 . 这 样 可 以 使 异常 抛 给 你 的 用 户 来 处 理 . 如 果 你 明确 的 想 












































屏蔽 这 个 异常 , 返回 一 个 布尔 为 True 的 值 . 如 果 没 有 发 生 异 常 或 你 在 处 理 异常 后 返回 True, 程序 会 继 
续 执 行 with 子 句 后 的 下 一 段 代 码 . 




















为 上 下 文 管理 器 主要 作用 于 共享 资源 , 你 可 以 想象 到 enter() 和 exitO — 方法 基本 是 干 
的 需要 分 配 和 释放 资源 的 低层 次 工作 , 比如 : 
数据 库 连 接 , 锁 分 配 , 信号 量 加 减 , 状态 管理 , 打开 /关闭 文件 , 异常 处 理 , 等 等 . 












































为 了 帮助 你 编写 对 象 的 上 下 文 管理 器 , 有 一 个 contextlib 模块 ,包含 了 实用 的 
functions/decorators, 你 可 以 用 在 你 的 函数 /对 象 上 而 不 用 去 操心 关于 类 或 
”context Q), enter() , enter() , exit() ”这些 方法 的 实现 . 

















想 了 解 更 多 关于 上 下 文 管理 器 的 信息 , 查看 官方 的 Python 文档 的 with 语法 和 contextlib 模块 ， 
类 的 指定 方法 (与 with M contexts 相关 的 ), PEP 343, #1 “What? s New in Python 2.5(Python 2.5 
的 更 新 ) ”的 文档 . 











10.5 # 字 符 串 作为 异常 














早 在 Python 1.5 前 , 标准 的 异常 是 基于 字符 串 实 现 的 . 然而 , 这 样 就 限制 了 异常 之 间 不 能 有 相互 
的 关系 . 这 种 情况 随 着 异常 类 的 来 临 而 不 复 存在 . 到 1.5 WE, 所 有 的 标准 异常 都 是 类 了 .程序 员 还 是 
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可 以 用 字符 串 作 为 自己 的 异常 的 , 但 是 我 们 建议 从 现在 起 使 用 异常 类 . 

















为 了 向 后 兼容 性 , 还 是 可 以 启用 基于 字符 串 的 异常 . 从 命令 行 以 -X 为 参数 启动 Python 可 以 提供 你 
字符 串 方 式 的 标准 异常 . 从 Py thon. 6 起 这 个 特性 被 视 为 废弃 的 . 























Python 2. 5 开始 处 理 向 来 不 赞成 使 用 的 字符 串 异 常 . 在 2. 5 中 , 触发 字符 串 异 常会 导致 一 个 警告 . 
在 2.6, 捕获 字符 串 异常 会 导致 一 个 警告 . 由 于 它 很 少 被 使 用 而 且 已 经 被 废弃 , 我 们 将 不 再 在 本 书 范围 
内 考虑 字符 串 异 常 并 且 已 经 去 除 相 关 文 字 .〈 在 本 书 的 早期 的 版 本 中 你 会 找到 这 些 . ) 唯一 也 是 最 后 的 
中 肯 警 告 是 :你 可 能 用 到 仍然 使 用 着 字符 串 异 常 的 外 部 或 第 三 方 的 模块 .字符 串 蜡 常 总 而 言 之 是 一 个 
糟糕 的 想法 . 读者 可 以 回想 , 有 着 拼写 错误 的 Linux RPM 异常 如 在 眼前 . 





















































10.6 触发 异常 











到 目前 为 止 , 我 们 所 见 到 的 异常 都 是 由 解释 器 引发 的 . 由 于 执行 期 间 的 错误 而 引发 . 程序 员 在 编 
写 API 时 也 希望 在 遇 到 错误 的 输入 时 触发 异常 , 为 此 , Python 提供 了 一 种 机 制 让 程序 员 明 确 的 触发 异 


常 : 这 就 是 raise 语句 . 


























10.6.1 raise 语句 


语法 与 惯用 法 


raise 语句 对 所 支持 是 参数 十 分 灵活 , 对 应 到 语法 上 就 是 支持 许多 不 同 的 格式 . rasie 一 般 的 用 法 


是 : 
raise [SomeException [, args [, traceback/]] 


第 一 个 参数 , SomeExcpetion, 是 触发 异常 的 名 字 . 如 果 有 , 它 必 须 是 一 个 字符 串 , 类 或 实例 ( 详 见 
下 文 ). 如 果 有 其 他 参数 (arg 或 traceback), 就 必须 提供 SomeExcpetion. Python 所 有 的 标准 异常 见 表 
10. 2. 


























第 二 个 符号 为 可 选 的 args (比如 参数 , 值 ), 来 传 给 异常 . 这 可 以 是 一 个 单独 的 对 象 也 可 以 是 一 个 
对 象 的 元 组 . Ses ACEI, 异常 的 参数 总 是 作为 一 个 元 组 传 入 . 如 果 args 原本 就 是 元 组 , 那么 就 将 其 
传 给 异常 去 处 理 ; 如 果 args 是 一 个 单独 的 对 象 , 就 生成 只 有 一 个 元 素 的 元 组 (就 是 单元 素 元 组 ). 大 多 
数 情况 下 , 单一 的 字符 串 用 来 指示 错误 的 原因 . 如 果 传 的 是 元 组 , 通常 的 组 成 是 一 个 错误 字符 串 , 一 个 
错误 编号 , 可 能 还 有 一 个 错误 的 地 址 , 比如 文件 , 等 等 . 









































最 后 一 项 参数 , traceback, 同样 是 可 选 的 (实际 上 很 少 用 它 ), 如 果 有 的 话 , 则 是 当 异 常 触发 时 新 
生成 的 一 个 用 于 异常 -正常 化 (exception 一 normally) 的 追踪 (traceback) 对 象 . 当 你 想 重新 引发 异常 
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时 , 第 三 个 参数 很 有 用 (可 以 用 来 区 分 先前 和 当前 的 位 置 ). 如 果 没 有 这 个 参数 , 就 填写 None. 





最 常见 的 用 法 为 SomeException 是 一 个 类 . 不 需要 其 他 的 参数 , 但 如 果 有 的 话 , 可 以 是 一 个 单一 对 
BBR, 一 个 参数 的 元 组 , 或 一 个 异常 类 的 实例 . 如 果 参 数 是 一 个 实例 , 可 以 由 给 出 的 类 及 其 派生 类 实 
例 化 (已 存在 异常 类 的 子 集 ). 车 参数 为 实例 , 则 不 能 有 更 多 的 其 他 参数 . 





更 多 的 特殊 /少见 的 惯用 法 


当 参 数 是 一 个 实例 的 时 候 会 发 生 什么 呢 ? 该 实例 若是 给 定 异常 类 的 实例 当然 不 会 有 问题 ， 然 而 ， 
如 果 该 实例 并 非 这 个 异常 类 或 其 子 类 的 实例 时 ， 那 么 解释 器 将 使 用 该 实例 的 异常 参数 创建 一 个 给 定 
异常 类 的 新 实例 . 如果 该 实例 是 给 定 异常 类 子 类 的 实例 ， 那 么 新 实例 将 作为 异常 类 的 子 类 出 现 ， 而 
不 是 原来 的 给 定 异 常 类 . 





























WR raise 语句 的 额外 参数 不 是 一 个 实例 一 一 作为 蔡 代 , 是 一 个 单 件 (singleton) 或 元 组 一 那么 ， 
将 用 这 些 作为 此 异常 类 的 初始 化 的 参数 列表 . 如 果 不 存 在 第 二 个 参数 或 是 None, 则 参数 列表 为 空 . 


如 果 SomeException 是 一 个 实例 , 我 们 就 无 需 对 什么 进行 实例 化 了 . 这 种 情况 下 , 不 能 有 额外 的 参 
数 或 只 能 是 None. 
异常 的 类 型 就 是 实例 的 类 ;也 就 是 说 , 等 价 于 触发 此 类 异常 , 并 用 该 实例 为 参数 :比如 raise 


instance. class , instance. 























我 们 建议 用 异常 类 , 不 赞成 用 字符 串 异 常 . 但 如 果 用 字符 串 作 为 SomeException, 那么 会 触发 一 
个 用 字符 串 标识 的 异常 , 还 有 一 个 可 选 的 参量 (args) (FER. 











最 后 , 这 种 不 含 任何 参数 的 rai se 语句 结构 是 在 Python1. 5 中 新 引进 的 , 会 引发 当前 代码 块 (code 
block) 最 近 触 发 的 一 个 异常 . 如 果 之 前 没有 异常 触发 , 会 因为 没 可 以 有 重新 触发 的 异常 而 生成 一 个 


TypeError 异常 . 





























由 于 raise 有 许多 不 同 格式 有 效 语法 (比如 :SomeException 可 以 是 类 , 实例 或 一 个 字符 串 ) , 我 们 
提供 表 10. 1 来 阐明 rasie 的 不 同 用 法 . 











# 10.1 raise 语句 的 用 法 





rasie 语法 描述 
raise exclass 触发 一 个 异常 , 从 exclass 生成 一 个 实例 (不 含 任何 异常 参数 ) 
raise exclass() 同上 , 除了 现在 不 是 类 ;通过 函数 调用 操作 符 (function calloperator: 





“QO “) 作 用 于 类 名 生成 一 个 新 的 exclass 实例 , 同样 也 没有 异常 参数 
raise exclass, args ”同上 ,但 同时 提供 的 异常 参数 args, 可 以 是 一 个 参数 也 可 以 元 组 
raise exclass (args) 同上 
raise exclass, args, tb 同上 , 但 提供 一 个 追踪 (traceback) 对 象 tb 供 使 用 
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raise exclass, instance ”通过 实例 触发 异常 (通常 是 exclass 的 实例 ) ;如 果实 例 是 exclass 
的 子 类 实例 , 那么 这 个 新 异常 的 类 型 会 是 子 类 的 类 型 (而 不 是 
exclass) ;如 果实 例 既 不 是 exclass 的 实例 也 不 是 exclass FAN 
实例 , 那么 会 复制 此 实例 为 异常 参数 去 生成 一 个 新 的 exclass 实例 . 





























raise instance 通过 实例 触发 异常 :异常 类 型 是 实例 的 类 型 ;等 价 于 raise 
instance. class , instance (同上 ). 
raise string (过 时 的 ) 触发 字符 串 异 常 
raise string, args 同上 , 但 触发 伴随 着 args 
raise string, args, tb 同上 ,但 提供 了 一 个 追踪 (traceback) 对象 tb 供 使 用 
raise (1. 5 新 增 ) 重 新 触发 前 一 个 异常 , 如 果 之 前 没有 异常 , 触发 TypeError. 
10.7 断言 








断言 是 一 句 必须 等 价 于 布尔 真 的 判定 ;此 外 , 发生 异常 也 意味 着 表达 式 为 假 . 这 些 工作 类 似 于 C 语 
言 预 处 理 器 中 assert ZZ, 但 在 Python 中 它们 在 运行 时 构建 (与 之 相对 的 是 编译 期 判别 ). 



































如 果 你 刚刚 接触 断言 这 个 概念 , 无 妨 . 断言 可 以 简 简 单单 的 想象 为 raise-if 语句 (更 准确 的 说 是 
raise-if-not 语句 ). 测试 一 个 表达 式 , 如 果 返 回 值 是 假 , 触发 异常 . 


断言 通过 assert 语句 实现 , 在 1.5 版 中 引入 . 


10.7.1 断言 语句 


断言 语句 等 价 于 这 样 的 Python 表达 式 , 如 果断 言 成 功 不 采取 任何 措施 (类 似 语句 ), 否则 触发 


AssertionError (断言 错误 ) We. assert 的 语法 如 下 : 








assert expression[, arguments] 








下 面 有 一 些 演示 assert 用 法 的 语句 : 


assert 7 == 1 
assert 2 + 2-- 2 * 2 

assert len({’my list’, 12/) < 10 
assert range(3) == [0, 1, 2/ 


AssertionError 异常 和 其 他 的 异常 一 样 可 以 用 try-except WR, 但 是 如 果 没 有 捕捉 , 它 将 
终止 程序 运行 而 且 提 供 一 个 如 下 的 traceback: 
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225 assert I == 0 
Traceback (innermost last): File “<stdin>”, line 1, in ? 


ÁAssertionÉrror 

















如 同 先 前 章节 我 们 研究 的 raise 语句 , 我 们 可 以 提供 一 个 异常 参数 给 我 们 的 assert 命令 : 





22» assert 1 == 0, 'Üne does not equal zero silly!’ Traceback (innermost last): 
File “<stdim”*, line l, in ? 
AssertionError: One does not equal zero silly! 


下 面 是 我 们 如 何 用 try-except 语句 捕获 AssertionError 异常 : 


try: 

assert 1 == 0, "One does not equal zero silly!’ 
except AssertionError, args: 

print “s: %s’ % (args. class . name , args) 





从 命令 行 执行 上 面 的 代码 会 导致 如 下 的 输出 : 
AssertionError: One does not equal zero silly! 


为 了 让 你 更 加 了 解 assert 如 何 运作 , 想象 一 下 断言 语句 在 Python 中 如 何 用 函数 实现 . 可 以 像 下 
面 这 样 : 


def assert(expr, args-None): 
if | debug | and not expr: 


raise AssertionError, args 





此 处 的 if 语句 检查 assert 的 语法 是 否 合适 , 也 就 是 expr 必须 是 一 个 表达 式 . 我 们 比较 expr 
的 类 型 和 真正 的 表达 式 来 确认 . 函数 的 第 二 部 分 对 表达 式 求 值 然 后 根据 结果 选择 性 的 引发 异常 . 内 建 
[Wake debug 在 通常 情况 下 为 True, 如 果 开 启 优化 后 为 False (命令 行 选项 -0) (Python 2.2 后 为 
布尔 值 True 和 False. ) 
































10.8 标准 异常 





K 10.2 列 出 了 所 有 的 Python 当前 的 标准 异常 集 , 所 有 的 异常 都 是 内 建 的 .所 以 它们 在 脚本 启动 
前 或 在 互 交 命令 行 提示 符 出 现时 已 经 是 可 用 的 了 . 











表 10.2 Python 内 建 异 常 
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异常 名 称 描述 
BaseException” 所 有 异常 的 基 类 
SystemExi t" python 解释 器 请 求 退出 
KeyboardInterrupt® 用 户 中 断 执行 (通常 是 输入 “C) 
Exception' 常规 错误 的 基 类 
StopIteration® 迭代 器 没有 更 多 的 值 


GeneratorExit' 生成 器 (generator) 发 生 异 常 来 通知 退出 
SystemExi t" Python 解释 器 请 求 退 出 


















































StandardError' 所 有 的 内 建 标 准 异 常 的 基 类 
ArithmeticError' 所 有 数值 计算 错误 的 基 类 
FloatingPointError* 浮 点 计算 错误 
OverflowError 数值 运算 超出 最 大 限制 
ZeroDivisionError 除 ( 或 取 模 ) 零 (所 有 数据 类 型 ) 
AssertionError' 断言 语句 失败 
AttributeError 对 象 没有 这 个 属性 
EOFError 没有 内 建 输入 , 到 达 EOF 标记 
EnvironmentError® 操作 系统 错误 的 基 类 
IOError 输入 /输出 操作 失败 
OSError' 操作 系统 错误 
WindowsError' Windows 系统 调用 失败 
ImportError 导入 模块 /对 象 失 败 
KeyboardInterrupt' 用 户 中 断 执行 (通常 是 输入 “C) 
LookupError* 无 效 数据 查询 的 基 类 
IndexError 序列 中 没有 没有 此 索引 (index) 
KeyError 映射 中 没有 这 个 键 
MemoryError 内 存 溢出 错误 (对 于 Python 解释 器 不 是 致命 的 ) 


NameError 未 声明 /初始 化 对 象 (没有 属性 ) 
UnboundLocalErrorh 访问 未 初始 化 的 本 地 变量 
ReferenceError” 弱 引 用 (Weak reference) 试 图 访问 已 经 垃圾 回收 了 的 对 象 

















RuntimeError 一 般 的 运行 时 错误 
NotImplementedError 尚未 实现 的 方法 
SyntaxError Python 语法 错误 
IndentationError' 缩 进 错误 

TabError* Tab 和 空格 混用 
SystemError 一 般 的 解释 器 系统 错误 


TypeError 对 类 型 无 效 的 操作 

ValueError 传 入 无 效 的 参数 

UnicodeError" Unicode 相关 的 错误 
UnicodeDecodeError' Unicode 解码 时 的 错误 
UnicodeEncodeError' Unicode 编码 时 错误 
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UnicodeTranslateError Unicode 转换 时 错误 

Warning 警告 的 基 类 

DeprecationWarning 关于 被 弃 用 的 特征 的 警告 

FutureWarning ”关于 构造 将 来 语义 会 有 改变 的 警告 
OverflowWarning' 旧 的 关于 自动 提升 为 长 整 型 (1ong) 的 警告 
PendingDeprecationWarning 关于 特性 将 会 被 废弃 的 警告 
RuntimeWarning! 可 疑 的 运行 时 行为 (runtime behavior) 的 警告 
SyntaxWarning 可 疑 的 语法 的 警告 

UserWarning’ 用 户 代 码 生 成 的 警告 














a. Python2. 5 新 增 

b. Æ Python2. 5 前 , Exception 的 子 类 SystemExit 

c. f£ Python2. 5 前 , StandardError 的 子 类 KeyboardInterrupt 
d. Pythonl. 5 新 增 , 用 基于 类 的 异常 来 蔡 代 字符 串 

e. Python2. 2 新 

f. Pythonl. 6 新 

g. Python2. 0 Xr} 

h. Pythonl. 6 新 
i. Python2. 3 新 + 
j. Python2. 1 #rt 
k. Python2. 2 新 增 , 但 在 Python2. 4 时 移 除 
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所 有 的 标准 /内 建 异 常 都 是 从 根 异 常 派 生 的 . 目前 ,有 3 个 直接 从 BaseException 派生 的 异常 子 
类 :SystemExit, KeyboardInterrupt 和 Exception. 其 他 的 所 有 的 内 建 异 常 都 是 Exception 的 子 类 . 3€ 
10. 2 中 的 每 一 层 缩 进 都 代表 一 次 异常 类 的 派生 . 














到 了 Python2. 5, 所 有 的 异常 的 都 是 新 风格 (new-style) 的 类 , 并 且 最 终 都 是 BaseException 的 子 
类 . 在 这 一 版 中 , SystemExit F KeyboardInterrupt 从 Exception 的 继承 中 移 到 BaseException 的 继 
承 下 . 这 样 可 以 允许 如 except Exception 的 语句 捕获 所 有 非 控 制程 序 退 出 的 异常 . 











从 Pythonl. 5 到 Python2. 4. x, 异常 是 标准 的 类 , 在 这 之 前 , 他 们 是 字符 串 . 从 Python2. 5 开始 , 不 
再 支持 构建 基于 字符 串 的 异常 并 且 被 正式 的 弃 用 , 也 就 是 说 你 不 能 再 触发 一 个 字符 串 异 常 了 .在 2.6, 
你 将 不 能 捕获 他 们 . 还 有 一 个 要 求 就 是 所 有 新 的 异常 最 终 都 是 BaseException 的 子 类 , 以 便于 他 们 有 
一 个 统一 的 接口 . 这 将 从 Python2.7 开始 , 并 在 余下 的 Python2. x 发 布 版 中 延续 . 





























10.9 «gem 





尽管 标准 异常 集 包含 的 内 容 已 经 相当 广泛 , 你 还 是 可 以 创建 自己 的 异常 . 一 种 情况 是 你 想 在 特定 
的 标准 异常 和 模块 异常 中 添加 额外 的 信息 . 我 们 将 介绍 两 个 例子 , 都 与 IOError AX. IOError 是 一 个 
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用 于 输入 /输出 的 通用 异常 , 可 能 在 无 效 的 文件 访问 或 其 他 形式 的 通信 中 触发 . 假如 我 们 想 要 更 加 明 
有 的 标明 问题 的 来 源 , 比如 :对 于 文件 错误 , 我 们 希望 有 行为 类 似 IOError 的 一 个 FileError 异常 ,但 
是 名 字 表 明 是 在 执行 文件 操作 . 




















zu 














我 们 将 查看 的 另 一 个 异常 与 套 接 字 (socket) 网 络 编程 有 关 . socket 模块 生成 的 异常 叫 
socket. error, 不 是 内 建 的 异常 . 它 从 通用 Exception 类 派生 . 然而 socket. error 这 个 异常 的 宗旨 和 
IOError 很 类 似 , 所 以 我 们 打算 定义 一 个 新 的 从 IOError 派生 的 NetworkError 的 异常 ,但 是 其 包含 了 


socket. error 提供 的 信息 . 























如 同类 和 面向 对 象 编程 , 我 们 暂时 不 会 正式 介绍 网 络 编程 , 如 果 你 需要 的 话 可 以 跳 到 16 章 . 


我 们 现在 给 出 一 个 叫做 myexc. py 的 模块 和 我 们 自 定义 的 新 异常 FileError 与 NetworkError. 代 
fup 10. 2. 











51:10. 2 创建 异常 (myexc. py) 


此 模块 定义 了 两 个 新 的 异常 ,FileError 和 NetworkError, 也 重新 实现 了 一 个 诊断 版 的 
open () [myopen O ] fll. socket. connect () [myconnect O ]. 同时 包含 了 一 个 测试 函数 [test O ], 当 直 接 
运行 文件 时 执行 . 








7 "l/usr/bin/env python 
import os, socket, errno, types, tempfile 


class NetworkError (IOError) : 


pass 


class FileError (IÜError) : 


pass 


def updArgs (args, newarg-None): 

if isinstance(args, I0Error): 

myargs = [] 

myargs. extend (larg for arg in args/) 
else: 

myargs = list (args) 


If newarg: 
myargs. append (newarg) 
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21 return tuple (myargs) 

22 

23 def fileArgs (file, mode, args): 
24 if args[0] == errno. EACCES and | 
pa 'access! in dir(os): 





26 perms =?’ 

27 permd = { 'r': os. R OK, "w': os. WOK, 
28 *x’: os. X OK} 

29 pkeys = permd. keys () 

30 pkeys. sort () 

31 pkeys. reverse () 

32 

33 for eachPerm in 'rwx': 

34 if os. access (file, permd[eachPerm]) : 
35 perms += eachPerm 


36 else: 
37 perms 人 “一 
38 
39 if isinstance (args, I0Error): 


40 myargs = [] 
4] myargs. extend([arg for arg in args/) 


42 else: 
43 myargs = list (args) 
44 


45 myargs[1] = “s? %s (perms: 'Ws')^ % | 
46 (mode, myargs[1]/, perms) 


47 

48 myargs. append (args. filename) 
49 

50 else: 

jl myargs = args 

32 

53 return tuple (myargs) 

54 

55 def myconnect(sock, host, port): 
56 try: 

57 sock. connect ((host, port)) 
I8 

59 except socket. error, args: 


myargs = updArgs (args) # conv instZtuple 
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61 
62 
63 
64 
65 
66 
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if len(myargs) == 1: # no £s on some errs 
myargs = (errno. ENXIO, myargs[0]) 


raise NetworkError, | 


# 


updArgs (myargs, host + ':' + str(port)) 


67 def myopen(file, mode-'r'): 


68 
69 
70 
71 
72 
73 
74 
15 
76 
77 
78 
79 
80 
81 
82 
83 
84 
CO 
86 
87 
88 
89 
90 
91 
92 
93 
94 
95 
96 


try. 
fo = open(file, mode) 
except lÜError, args: 
raise FileError, fileArgs(file, mode, args) 


return fo 
def testfileQ: 


file = mktemp () 
f = open(file, °w) 
f. close Q 


for eachTest in ((0, `r’), (0100, ’r’), 
(0400, 'w'), (0500, ’w’)): 

try: 

os. chmod (file, eachTest[0]) 

f = myopen(file, eachTest[1/) 


except Filekrror, args: 
print “s: “s” % | 


(args. class . name , args) 





else: 
print file, “opened ok... perm ignored^ 
f. close) 


os. chmod (file, 0777)# enable all perms 
os. unlink (file) 


97 def testnet(): 


98 
99 
100 








s = socket. socket (socket. AF INET, 
socket. SOCK STREAM) 
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101 for eachHost in (deli’, ’www’): 





102 try: 

103 myconnect(s, 'deli', 8080) 

104 except NetworkError, args: 

105 | print “%s: 4s” % | 

106 (args. class . name , args) 
107 

108 if name ==’ main 





109 testfile() 
110 testnet () 


4 


471-3 
模块 的 开始 部 分 是 Unix 启动 脚本 和 socket, os, errno, types 和 tempfile 模块 的 导入 . 


行 5-9 
无 论 你 是 否 相 信 , 这 5 行 代码 定义 了 我 们 的 新 异常 . 不 是 仅仅 一 个 , 而 是 两 个 . 除了 将 要 介绍 的 一 
个 新 功能 , 创建 一 个 新 的 异常 仅 需要 从 一 个 已 经 存在 的 异常 类 派生 一 个 出 子 类 . 本 例 中 , 这 个 基 类 是 
IOError， 我 们 也 可 以 从 IOError 的 基 类 EnvironmentError 派生 , 但 我 们 想 明 确 表 明 我 们 的 异常 是 
1/0 相关 的 . 


















































我 们 选择 IOError 是 因为 它 提供 了 两 个 参数 , 一 个 错误 编号 和 一 个 错误 字符 串 . 文件 相关 [用 
open 0 JAY IOError 异常 甚至 支持 大 部 分 异常 没有 的 第 三 个 参数 , 那个 可 以 是 文件 名 . 我 们 将 对 这 个 在 
主要 元 组 之 外 的 , AFM filename 的 参数 执行 一 些 特定 的 操作 . 

















行 11-21 

updArgs O 函数 的 全 部 意图 就 是 “更 新 “异常 的 参数 . 我 们 这 里 的 意思 是 原来 的 异常 提供 给 我 们 一 
个 参数 集 . 我 们 希望 获取 这 些 参数 并 让 其 成 为 我 们 新 的 异常 的 一 部 分 , 可 能 是 散 入 或 添加 第 三 个 参数 
(如 果 没 有 传 入 , 什么 也 不 添加 一 None 是 其 默认 值 , 我 们 下 一 章 将 会 学 习 ). 我 们 的 目标 是 提供 更 多 的 
细节 信息 给 用 户 , 这 样 当 问题 发 生 时 能 够 尽快 的 捕捉 到 . 









































Lines 23- 53 

函数 fileArgs O {ME myopen 上 中 使 用 (如 下 ). 实际 上 ,我 们 寻找 表示 ”permissiondenied. (没有 
权限 .) 的 错误 EACCES. 其 他 所 有 的 IOError 异常 我 们 将 不 加 修改 ( 行 54-55) 的 传递 . 如 果 你 对 ENXIO, 
EACCES 和 其 他 的 系统 错误 号 感到 好 奇 , 你 可 以 从 Unix 系统 下 /usr/include/sys/errno.h 或 Windows 
系统 下 Visula C++ 的 C:\Msdev\include\Errno. h 文件 来 对 它们 刨 根 究 底 . 




















在 第 27 4T, 我 们 也 确认 了 我 们 当前 使 用 的 机 器 支持 os. access O 函数 , 它 用 来 检查 对 任意 一 个 特 
定 文件 你 所 拥有 的 权限 . 除非 我 们 收 到 权限 错误 同时 也 能 够 检查 我 们 拥有 的 权限 , 否则 我 们 什么 不 做 . 
当 一 切 完 毕 , 我 们 设置 一 个 字典 来 帮助 构建 表示 我 们 对 文件 所 拥有 的 权限 的 字符 串 . 











$— 一 * 一 
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Unix 文件 系统 清晰 标明 用 户 (user), 2H (group, 可 以 有 多 个 用 户 属 于 一 个 组 ) 和 其 他 (other, 不 是 
所 有 者 , 也 不 和 所 有 者 同 组 的 用 户 ) 对 文件 的 读 , 写 , DAT Cm, wo’, “x”) 的 权限 . 

Windows 支持 这 些 权限 中 的 一 部 分 . 现在 可 以 来 构建 权限 字符 串 了 . 如 果 对 文件 有 某 种 权限 , 字符 
串 中 就 有 相应 的 字母 , 否则 用 — BAR.. 比如 , FRR rw 标明 你 可 以 对 其 进行 读 / 写 访问 . 如 果 字 符 
FR e" rox ,你 仅 可 以 对 其 进行 读 和 执行 操作 ; — 标示 没有 任何 权限 . 
































当权 限 字 符 串 构建 完成 后 , 我 们 创建 了 一 个 临时 的 参数 列表 . 我 们 随后 更 改 了 错误 字符 串 使 之 包 
含 权限 字符 串 . (标准 的 IOError 异常 并 没有 提供 权限 字符 串 相关 信息 ). 如 果 系 统 并 没有 告诉 你 具有 
什么 权限 才能 来 解决 这 个 问题 ， 而 只 是 显示 ”Permission denied( 没 有 权限 )” 这 个 错误 信息 ， 这 似 
FERRAR. 当然 这 是 出 于 安全 的 考虑 . 当 入 侵 者 没有 权限 访问 某 个 数据 的 时 候 ， 最 好 不 要 让 他 们 
看 到 这 个 文件 的 权限 是 什么 。 不 过 ， 我 们 的 例子 仅仅 是 一 个 练习 ， 所 以 我 们 可 以 暂时 “违背 安全 “ 信 
条 。 问题 的 关键 在 于 确认 调用 os.chmodO 函数 ， 它 能 够 按照 你 的 意愿 来 修改 文件 的 权限 。 





















































最 后 一 件 事情 我 们 把 文件 名 加 入 参数 列表 , 并 以 元 组 形式 返回 参数 . 





行 55-65 
我 们 新 的 myconnect O 函数 仅仅 是 简单 的 对 套 接 字 的 函数 conect O 进行 包装 当 网 络 连 接 失 败 时 
提供 一 个 IOError 类 型 的 异常 . 和 一 般 的 socket. error 不 一 样 , 我 们 还 提供 给 程序 员 主 机 名 和 端口 


























对 于 刚刚 接触 网 络 编程 的 , 主机 名 和 端口 号 可 以 想象 为 当 你 联系 某 人 时 的 区 号 和 电话 号 . 在 这 
个 例子 中 ,我 们 试 着 去 连接 一 个 在 远程 主机 上 运行 的 程序 , 可 能 是 茶 种 服务 .因此 我 们 需要 知道 主机 
名 和 服务 器 监听 的 端口 . 











当 失 败 发 生 时 , 错误 号 和 错误 字符 很 有 帮助 , 但 是 如 果 结 合 更 精确 的 主机 -端口 会 更 有 帮助 , 因为 
这 一 对 可 能 是 由 某 个 数据 库 或 名 称 服务 动态 生成 或 重新 获得 . 这 些 值 由 我 们 版 本 的 connect O 加 入 . 
另 一 种 情形 是 无 法 找到 主机 , socket. error 异常 没有 直接 提供 的 错误 号 , 我 们 为 了 遵循 IOError 协议 ， 
提供 了 一 个 错误 号 -错误 字符 串 对 , 我 们 查找 最 接近 的 错误 号 . 我 们 选用 的 ENXI0. 



























































行 67-73 

类 似 同 类 myconnect (), myopen O 也 封装 了 已 经 存在 的 一 些 代码 . 这 里 , 我 们 用 的 是 open O 函数 . 
我 们 仅仅 捕捉 IOError 异常 .所 有 的 其 他 都 包 略 并 传 给 下 一 层 ( 因 为 没有 与 他 们 相关 的 处 理 器 ). 一 旦 
捕捉 到 IOError 我 们 引发 我 们 自己 的 异常 并 通过 fileArgs () 返 回 值 来 定制 参数 . 























行 75-95 

我 们 首先 测试 文件 , 这 里 使 用 testfile 0 函数. 开始 之 前 , 我 们 需要 新 建 一 个 测试 文件 , 以 便 我 们 
可 以 手工 的 修改 其 权限 来 造成 权限 错误 . 这 个 tempfile 模块 包含 了 创建 临时 文件 文件 名 和 临时 文件 
的 代码 . 当前 我 们 仅仅 需要 文件 名 , 然后 用 myopen O 函数 来 创建 一 个 空 的 文件 . 注意 , 如 果 此 次 产生 了 
错误 , 我 们 不 会 捕获 , 我 们 的 程序 将 致命 的 终止 一 一 测试 程序 当 我 们 连 文件 都 无 法 创建 时 不 会 继续 . 
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我 们 的 测试 用 了 4 种 不 同 的 权限 配置 . 零 标示 没有 任何 权限 , 0100 表示 仅 能 执行 , 0400 表示 只 
读 , 0500 表示 只 可 读 或 执行 (0400+0100). 在 所 有 的 情况 下 , 我 们 试图 用 一 种 无 效 的 方式 打开 文 
fF. os. chmod O 被 用 来 改变 文件 的 权限 (注意 :这 些 权 限 有 前 导 的 零 , 表明 他 们 是 八进制 [基数 8] 数 ) 

如 果 发 生 错误 , 我 们 希望 可 以 显示 诊断 的 信息 , 类 似 Python 解释 器 捕获 异常 时 所 做 的 那样 ， 这 就 
是 给 出 异常 名 和 紧 跟 其 后 的 异常 的 参数 . class 属性 表示 实例 化 该 实例 的 类 对 象 ， 比 在 此 显示 完 
整 的 类 名 (myexc. FileError) 更 好 的 做 法 是 通过 类 对 象 的 _name “属性 来 显示 类 名 (FileError), 这 
也 是 异常 未 被 捕获 时 你 在 解释 器 所 见 到 的 . 随后 是 我 们 在 封装 函数 中 辛 辛 昔 兰 聚 到 一 起 的 参数 . 









































如 果 文 件 被 打开 成 功 , 也 就 是 权限 由 于 某 种 原因 被 忽略 . 我 们 通过 诊断 信息 指明 并 关闭 文件 . 当 
所 有 的 测试 都 完成 时 , 我 们 对 文件 开启 所 有 的 权限 然后 用 os. un Link O 移 除 (os. remove O 等 价 于 


os. unlink()). 


行 97-106 

下 一 段 代码 (testnet 0 ) 测试 了 我 们 的 网 络 异 常 . 套 接 字 是 一 个 用 来 与 其 他 主机 建立 连接 的 通信 
端点 . 我 们 创建 一 个 套 接 字 , 然后 用 它 连接 一 个 没有 接受 我 们 连接 的 服务 器 的 主机 和 一 个 不 存在 于 我 
们 网 络 的 主机 . 























行 108-110 
我 们 希望 仅 在 直接 调用 我 们 脚本 时 执行 test*0 函数 , 此 处 的 代码 完成 了 该 功能 . 大 多 数 脚本 用 
同样 的 格式 给 出 了 这 段 文本 . 


在 Unix 系 的 机 器 上 运行 这 段 脚本 , 我 们 得 到 了 如 下 的 输出 : 


jmyexc. py 

FileError: [Errno 13] 'r' Permission denied (perms: '——'): 

'"/usr/tmp/018908. 1' 

FileError: [Errno 13] 'r' Permission denied (perms: '—x'): 

"/usr/tmp/018908. 1' 

FileError: [Errno 13] °w? Permission denied (perms: ’r-—’): 

"/usr/tmp/018908. 1” 

FileError: [Errno 13] °w? Permission denied (perms: ’r-x’): 

"/usr/tmp/018908. 1” 

NetworkError: [Errno 146] Connection refused: 'deli:9080' NetworkError: [Errno 6] host 
not found: '"www:8080' 


在 Win32 的 机 器 上 有 些许 的 不 同 : 


D:|python^ python myexc. py 
C: WINDOWS|TEMP|^-195619-1 opened ok... perms ignored C: VWINDOWS|TEMP| —-195619-1 
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opened ok... perms ignored FileError: [Errno 13] 'w! Permission denied (perms: 'r-x ): 
"C: WINDOWS | | TEMP | | ^7-195619-17 
FileError: [Errno 13] °w? Permission denied (perms: ’r-x’): 
"C: | WINDOWS | \ TEMP | | ^-195619-17 
NetworkError: [Errno 10061] winsock error: ’deli:8080’ NetworkError: [Errno 6] host 
not found: *www:8080’ 








你 可 以 看 到 Windows 不 支持 文件 的 读 权限 , 这 就 是 前 两 次 尝试 文件 打开 成 功 的 原因 . 在 你 的 机 器 
和 操作 系统 上 的 结果 可 能 会 大 相 径 庭 。 





10.10 ”为 什么 用 异常 (现在 )? 


ETC SERI, 错误 的 存在 会 伴随 着 软件 的 存在 . 区 别 在 于 当今 快 节奏 的 计算 世界 ， 我 们 的 执行 环境 
已经 改变 ， 所 以 我 们 需要 改变 错误 处 理 ， 以 准确 反映 我 们 软件 的 开发 环境 ， 就 现今 应 用 来 说 ， 普 遍 
的 是 自治 (self-contained) HABA HH (GUIs) 或 是 客户 机 /服务 器 体系 ， 例 如 Web. 



































在 应 用 层 处 理 错误 的 能 力 近 来 变 得 更 为 重要 ， 用 户 已 不 再 是 应 用 程序 的 的 唯一 的 直接 运行 者 . 
随 着 互联 网 和 网 上 电子 商业 应 用 越 来 越 普 及 , web 服务 器 将 成 为 应 用 软件 的 主要 客户 ， 这 意味 着 应 用 
程序 再 也 不 能 只 是 直接 的 失败 或 崩溃 ， 因 为 如 果 这 样 ， 系 统 错误 导致 浏览 器 的 错误 ， 这 反 过 来 又 
会 让 用 户 泪 丧 ， 失 去 眼球 意味 着 失去 广告 收入 和 和 潜在 的 大 量 无 可 挽回 的 生意 . * 















































如 果 错 误 的 确 发 生 了 ， 它 们 一 般 都 归 因 于 用 户 输入 的 数据 无 效 ， 运 行 环境 必须 足够 强健 , 来 处 
eee all gel elie dp ea 这 必须 转化 为 一 个 “ 非 错误 ”.， 因为 
应 用 必须 要 成 功 的 完成 ， 即 使 所 做 的 不 过 个 错误 的 信息 ， 向 用 户 是 提供 一 个 有 效 的 超 文 本 
标记 语言 (HTML) 的 网 页 指明 错误 . 





























如 果 你 不 清楚 我 在 说 什么 ， 那 个 一 个 简单 的 网 页 浏览 器 窗口 , 用 大 而 黑 的 字体 写 到 ”内 部 服务 器 
错误 是否 更 耳 熟 ? 用 一 个 弹出 式 窗 口 宣告 文件 中 没有 数据 的 致命 错误 如 何 ? 作为 一 个 用 户 ， 这 
些 词 语 对 你 有 意义 吗 ? 没有 ， 当 然 没 有 《除非 你 是 一 个 互联 网 软件 工程 师 ) ， 至 于 对 普通 用 户 来 说 ， 
这 些 是 无 休止 的 混乱 和 挫折 感 的 来 源 ， 这 些 错误 导致 在 执行 的 程序 时 的 失败 ， 应 用 不 论 是 返回 无 效 
的 超 文本 传输 协议 http) 数 据 还 是 致命 地 终止 ， 都 会 导致 Web 服务 器 举 手 投 降 ， 说 : “我 放弃 ”! 

















这 种 类 型 的 执行 错误 不 应 该 被 允许， 无 论 情况 如 何 ， 随 着 系统 变 得 更 加 复杂 ， 又 牵涉 到 更 多 的 
新 手 用 户 ， 要 采取 额外 的 措施 ， 确 保 用 户 平滑 的 学 到 应 用 经 验 ， 即使 面 对 一 20 eee 
的 中 止 ， 不 至 于 灾难 性 的 影响 其 执行 环境 .Python 异常 处 理 促使 成 熟 和 正确 的 编程 . 












































10.11 到 底 为 什么 要 异常 ? 





如 果 上 文 的 动机 不 够 充分 ， 试 想 Python 编程 没有 程序 级 的 异常 处 理 . 第 一 件 事 需 要 担心 的 是 客 
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户 端 程序 员 在 自己 的 代码 中 遗忘 控制 ， 举 例 来 说 ， 如 果 你 创造 了 一 个 交互 的 应 用 程序 分 配 并 使 用 了 
大 量 的 资源 ， 如 果 一 个 用 户 击 中 Ctrl+C 或 其 他 键盘 中 断 ， 应 用 程序 将 不 会 有 机 会 执行 清理 工作 ， 可 
能 导致 数据 丢失 或 数据 损坏 ， 此外， 也 没有 机 制 来 给 出 可 选 的 行为 ， 诸 如 提示 用 户 ， 以 确认 他 们 真 
的 是 想 退 出 或 是 他 们 意外 的 按 下 了 Ctrl i. 



































另 一 个 缺点 就 是 函数 必须 重 写 来 为 错误 的 情形 返回 一 个 “特殊 “的 值 ， 如 :None， 程序 员 要 负责 
检查 每 一 个 函数 调用 的 返回 值 . 这 可 能 是 个 肪 烦 ， 因 为 你 可 能 不 得 不 检查 返回 值 ， 这 和 没有 发 生 错 
误 时 你 期 竺 结果 也 许 不 是 同一 类 型 的 对 象 ， 什么 , 你 的 函数 要 把 None 作为 一 个 有 效 的 数值 返回 ? AB 
么 ， 你 将 不 得 不 拿 出 另 一 个 返回 值 ， 也 许 是 负数 . 我 们 也 许 并 不 需要 提醒 你 ， 在 Python 的 环境 下 负 
数 下 可 能 是 有 效 的 ， 比 如 作为 一 个 序列 的 索引 ， 作 为 一 个 写 应 用 程序 接口 〈 API ) 的 程序 员 ， 你 不 
得 不 为 每 个 一 个 用 户 输入 可 能 遇 到 的 返回 错误 写 文档 .同时 ， 我 们 难以 而 且 乏 味 ) 在 多 层次 的 代 
码 中 以 传播 错误 (和 原因 ). 















































没有 一 个 简单 的 传播 方法 像 异常 一 样 做 到 这 一 点 ， 因 为 错误 的 数据 需要 在 调用 层次 中 向 上 转发 ， 
但 在 前 进 的 道路 上 可 能 被 曲解 .一 个 不 相干 的 错误 可 能 会 被 宣布 为 起 因 , 而 实际 上 它 与 原始 问题 完 
全 无 关 . 在 一 层 一 层 的 传递 中 , 我 们 失去 了 对 原始 错误 封装 和 保管 的 能 力 , 更 不 用 说 完全 地 失去 我 们 
原本 关心 的 数据 的 踪影 ! 异 常 不 仅 简 化 代码 ， 而 且 简 化 整个 错误 管理 体系 --- 它 不 该 在 应 用 开发 中 
如 此 重要 角色 ;而 有 了 Python 的 异常 处 理 能 力 ， 也 的 确 没 有 必要 了 . 


10.12 异常 和 sys 模块 E 


另 一 种 获取 异常 信息 的 途径 是 通过 sys 模块 中 exc_info0 函数 .此 功能 提供 了 一 个 3 元 组 
(3-tuple) 的 信息 ， 多 于 我 们 单纯 用 异常 参数 所 能 获得 .让 我 们 看 看 如 何 用 sys. exc_info() : 















































225 try: 
float ( abc123’) 
. except: 
import sys 
exc tuple = sys. exc info() 


222 print exc tuple 

(<class exceptions. ValueError at 198385, «exceptions. ValueError instance at 122fa8>, 
<traceback object at 10de18>) 

p 


222 for eachItem in exc tuple: 
print eachltem 
. exceptions. ValueError 
invalid literal for float: abc123 














Edit By Vheavens 


Edit By Vheavens 


ee 
T 


<traceback object at 10del8> 








我 们 从 sys. exc infoO 得 到 的 元 组 中 是 : 

€ exc type: 异常 类 

€ exc value: 异常 类 的 实例 

€ exc traceback: 追踪 (traceback) 对 象 

我 们 所 熟悉 的 前 两 项 : 实际 的 异常 类 ， 和 这 个 异常 类 的 实例 (和 在 上 一 节 我 们 讨论 的 异常 参数 
是 一 样 的 ) . 第 三 项 ， 是 一 个 新 增 的 追踪 (traceback) HR. 这 一 对 象 提供 了 的 发 生 异 常 的 上 下 文 . 
它 包 含 诸 如 代码 的 执行 帧 , 异常 发 生 时 的 行 号 等 信息 . 












































在 旧版 本 中 的 Python 中 ， 这 三 个 值 分 别 存在 于 sys 模块 ， 为 sys. exc_type ， sys. exc value, 
sys.exc traceback .不幸 的 是 ， 这 三 者 是 全 局 变量 而 不 是 线程 安全 的 . RENCA E, H 
sys. exc_info () 来 代替 ， 在 未 来 版 本 Python 中 , 所 有 这 三 个 变量 都 将 被 逐步 停 用 , 并 最 终 移 除 . 


























10. 13 ”相关 模块 


表 10. 3 此 章 的 相关 模块 


表 10. 3 异常 相关 的 标准 库 * 
模块 uk 


exceptions 内 建 异 常 (永远 不 用 导入 这 个 模块 ) 
contextliba 为 使 用 with 语句 的 上 下 文 对 象 工具 
Sys 包含 各 种 异常 相关 的 对 象 和 函数 ( 见 sys. exx) 

















a. Python2. 5 新 增 


10.14 练习 








10-1. 引发 异常 ， 以 下 的 哪个 因素 会 在 程序 执行 时 引发 异常 ? 注意 这 里 我 们 问 的 并 不 是 异 
常 的 原因 . 











a) 用 户 

b) 解释 器 
c) 程序 

d) 以 上 所 有 
e) 只 有 b) 和 c) 
f) 只 有 a) 和 o) 
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10-2. 引发 异常 ， 参 考 上 边 问题 的 列表 ， 哪 些 因素 会 在 执行 交互 解释 器 时 引发 异常? 











10 - 3. 关键 字 ， 用 来 引发 异常 的 关键 字 有 那些 ? 





10-4. 关键 字 . try-except 和 try-finally 有 什么 不 同 ? 








10 - 5. 异常 ， 下 面 这 些 交 互 解释 器 下 的 Python 代码 段 分 别 会 引发 什么 异常 (参阅 表 10.2 
给 出 的 内 建 异常 清单 ) : 











(a) 2 if 3 < 4 then: print '3 IS less than 4!’ 

(b) 2» alist = ['Hello', 'World!', ’Anyone’, 'Home?'] 
2» print te last string in alist is:’, aList[len(aList)] 
(c) 225 X 

(d) D> X =4%40 

(e) 22^ import math 

2 i = math. sqrt C1) 





10 - 6. 改进 的 openO. 为 内 建 的 openO 函数 创建 一 个 封装 ， 使 得 成 功 打开 文件 后 ， 返 
回 文件 句柄 ; 若 打 开 失 败 则 返回 给 调用 者 None ， 而 不 是 生成 一 个 异常 ， 这 样 你 打开 文件 时 就 不 需 
要 额外 的 异常 处 理 语句 . 











10 - 7. 异常 ， 下面 两 段 Python 伪 代 码 a) 和 b) 有 什么 区 别 ? 考虑 语句 A 和 B 的 上 下 
文 环境 . (这 么 细致 的 区 别 要 感谢 “Guido ) 








(a) try: 
statement 4 


except. . .- 


else: 
statement B 
(b) try: 
statement 4 
statement B 


except. . .- 


10 - 8. 改进 的 raw input O . 本章 的 开头 ， 我 们 给 出 了 一 个 “安全 ”的 floatO 函数 ， 
它 建 立 在 内 建 函 数 floatO 上 ， 可 以 检测 并 处 理 floatO 可 能 会 引发 的 两 种 不 同 异 常 ， 同 样 ， 
raw_input) 函数 也 可 能 会 生成 两 种 异常 ，EOFError (文件 末尾 EOF, Æ Unix 下 是 由 于 按 下 了 
Ctrl+D 在 Dos 下 是 因为 Ctrl+Z) 或 是 KeyboardInterrupt (取消 输入 ， 一 般 是 由 于 按 下 了 
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Ctrl+C). 请 创建 一 个 封装 函数 safe input O ， 在 发 生 异 常 时 返回 None . 



































10 - 9. 改进 的 math. sart O. math 模块 包含 大 量 用 于 处 理 数值 相关 运算 的 函数 和 常量 .不 
幸 的 是 ， 它 不 能 识别 复数 ， 所 以 我 们 创建 了 cmath 模块 来 支持 复数 相关 运算 请 创建 一 个 
safe sqrt O 函数 ， 它 封装 math. sqrt () 并 能 处 理 负 值 ， 返 回 一 个 对 应 的 复数 . 
一 圭一 co 
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Chapter 1 1 


在 第 二 章 ， 我 们 引入 了 函数 ， 并 介绍 了 函数 的 创建 和 调用 。 这 一 章 ， 我 们 将 在 前 面 内 容 的 基础 
上 ， 详 细 的 讲解 函数 的 方方面面 。 除 了 预期 特性 之 外 ， Python 中 的 函数 还 支持 多 种 调用 方式 以 及 参 
数 类 型 并 实现 了 一 些 函 数 式 编程 接口 。 最 后 我 们 将 以 对 Python 变量 的 作用 域 和 递归 函数 的 讨论 来 结 


束 本 章 的 学 习 . 
11. 1 什么 是 函数 ? E 


函数 是 对 程序 逻辑 进行 结构 化 或 过 程 化 的 一 种 编程 方法 。 能 将 整 块 代码 巧妙 地 隔离 成 易于 管理 
的 小 块 ， 把 重复 代码 放 到 函数 中 而 不 是 进行 大 量 的 找 贝 一 这 样 既 能 节省 空间 ， 也 
有 助 于 保持 一 致 性 ， 因 为 你 只 需 改变 单个 的 找 贝 而 无 须 去 寻找 再 修改 大 量 复制 代码 的 拷贝 。 
Python 中 国 数 的 基础 部 分 与 你 熟悉 的 其 他 的 语言 没有 什么 不 同 . 本 章 开始 , 我 们 先 回顾 一 下 函数 基础 ， 
然后 将 着 重 介绍 python 函数 的 其 他 特性 . 
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函数 可 以 以 不 同 的 形式 出 现 。 下 面 简单 展示 了 一 些 创 建 、 使 用 ， 或 者 引用 函数 的 方法 。 
declaration/definitiondef foo(): print 'bar' 


function object/reference | foo 
function call/invocation foo() 


11. 1. 1 RM vs WE 





我 们 经 常 拿 函数 和 过 程 比较 。 两 者 都 是 可 以 被 调用 的 实体 , 但 是 传统 意义 上 的 函数 或 者 “ 黑 盒 ”， 
Ay 


可 能 不 带 任何 输入 参数 ， 经 过 一 定 的 处 理 ， 最 后 向 调用 者 传 回 返 回 值 。 其 中 一 些 函 数 则 是 布尔 类 型 
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的 ， 返回 一 个 “是 “或 者 “和 否 “ 的 回答 ， 更 确切 地 说 ， 一 个 非 零 或 者 零 值 。 而 过 程 是 简单 ， 特 殊 ， 
没有 返回 值 的 函数 。 从 后 面 内 容 你 会 看 到 ，python 的 过 程 就 是 函数 ， 因 为 解释 器 会 隐 式 地 返回 默认 
值 None 


























11. 1. 2. 返回 值 与 函数 类 型 








函数 会 向 调用 者 返回 一 个 值 ， 而 实际 编程 中 大 偏 函数 更 接近 过 程 ， 不 显示 地 返回 任何 东西 。 把 
过 程 看 待 成 函数 的 语言 通常 对 于 “什么 都 不 返回 ”的 函数 设 定 了 特殊 的 类 型 或 者 值 的 名 字 。 这 些 函 
数 在 c 中 默认 为 “void 的 返回 类 型 ， 意 思 是 没有 值 返 回 。 在 python 中 ， 对 应 的 返回 对 象 类 型 是 


nonee 








下 面 hello 0 函数 的 行为 就 像 一 个 过 程 ， 没 有 返回 值 。 如 果 保 存 了 返回 值 ， 该 值 为 None: 


2» def hello: 
print 'hello world’ 
225 
2» res = hello () 
hello world 


222 res 
222 print res 
None 


225» type (res) 
«type ° None’ > 





另外 , 与 其 他 大 多 数 的 语言 一 样 ，python 里 的 函数 可 以 返回 一 个 值 或 者 对 象 。 只 是 在 返回 一 个 容 
器 对 象 的 时 候 有 点 不 同 ， 看 起 来 像 是 能 返回 多 个 对 象 。 好 比 说 ， 你 不 能 拿 着 大 量 零 散 的 商品 离开 百 
货 店 ， 但 是 你 可 以 将 它们 放 在 一 个 购物 袋 里 ， 然 后 带 着 这 个 袋子 从 商店 走出 去 ， 合 理 合法 。 














def foo(): 
return [ xyz’, 1000000, -98. 6] 


def bar(): 
return ‘abc’, [42, 'python'], “Guido” 











foo () 函数 返回 一 个 列表 , bar 0 函数 返回 一 个 元 组 。 由 于 元 组 语法 上 不 需要 一 定 带 上 圆 括号 ， 所 
以 让 人 真 的 以 为 可 以 返回 多 个 对 象 。 如 果 我 们 要 恰当 地 给 这 个 元 组 加 上 括号 ， bar O 的 定义 看 起 来 
会 是 这 样 : 








def bar(): 
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return (abc’, [4-2j, ’python’/, Guido’) 


从 返回 值 的 角度 来 考虑 ， 可 以 通过 很 多 方式 来 存储 元 组 。 接 下 来 的 3 种 保存 返回 值 的 方式 是 等 


价 的 





2» afuple = bar 0 

2 & y, z = bar 

poe (a, b, cl = bar 

225 

22^ afuple 

Cabec’, [(4-2j), 'python' ], 'Guido') 
22^X, Vy Z 

Cabe’, [(4-2j), 'python' ], 'Guido') 
2» (a, b, c) 

Cabe’, [(4-2j), ‘python’ ], 'Guido') 














在 对 x,y,z 和 a,b,c 的 赋值 中 ， 根 据 值 返回 的 顺序 ， 每 个 变量 会 接收 到 与 之 对 应 的 返回 值 。 而 
aTuple 直接 获得 函数 隐 式 返回 的 整个 元 组 。 回 想 一 下 , 元 组 既 可 以 被 分 解 成 为 单独 的 变量 ， 也 可 以 直 
接 用 单一 变量 对 其 进行 引用 。( 人 参见 6. 18. 3) 


简 而 言 之 ， 当 没有 显 式 地 返回 元 素 或 者 如 果 返 回 None 时 ， 











python 会 返回 一 个 None. 那么 调用 


者 接收 的 就 是 python 返回 的 那个 对 象 , 且 对 象 的 类 型 仍然 相同 。 如 果 函 数 返回 多 个 对 象 ，python 把 
他 们 聚集 起 来 并 以 一 个 元 组 返回 。 是 的 ， 尽 管 我 们 声称 python 比 诸如 c 那样 只 允许 一 
言 灵活 的 多 ， 但 是 老实 说 ，python 也 遵循 了 相同 的 传统 。 只 是 让 程序 员 误 以 为 可 以 返 








个 返回 值 的 语 








# 11.1 返回 值 及 其 类 型 


Table 11.1 Return Values and Types 


Stated Number 


of Objectsto Type of Object That 
Return Python Returns 


0 None 
l object 


>] tuple 





# 11.1 总 结 了 从 一 个 函数 中 返回 的 元 素 的 数目 ， 以 及 python 实际 返回 的 对 象 。 


$— 
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回 多 个 对 象 。 
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许多 静态 类 型 的 语言 主张 一 个 函数 的 类 型 就 是 其 返回 值 的 类 型 。 在 python 中 ， 由 于 python 是 
动态 地 确定 类 型 而 且 函 数 能 返回 不 同类 型 的 值 ， 所 以 没有 进行 直接 的 类 型 关联 。 因 为 重 载 并 不 是 语 




















言 特性 ， 程 序 员 需要 使 用 type 0 这 个 内 建 函 数 作为 代理 ， 来 处 理 有 着 不 同 参 数 类 型 的 函数 的 多 重 声 
明 以 模拟 类 C 语言 的 函数 重 载 (以 参数 不 同 选 择 函 数 的 多 个 原型 ) 。 











11.2 调用 函数 
11. 2. 1. 函数 操作 符 





同 大 多 数 语言 相同 ， 我 们 用 一 对 圆 括号 调用 函数 。 实 际 上 ， 有 些 人 认为 (0 ) 是 一 个 双 字 符 操作 
符 。 正 如 你 可 能 意识 到 的 ， 任 何 输入 的 参数 都 必须 放置 在 括号 中 。 作 为 函数 声明 的 一 部 分 ， 括 号 也 
会 用 来 定义 那些 参数 。 虽 然 我 们 没有 正式 地 学 习 类 和 面向 对 象 编程 ， 但 你 将 会 发 现在 python H, PR 
数 的 操作 符 同 样 用 于 类 的 实例 化 。 








11. 2. 2. 关键 字 参 数 


关键 字 参 数 的 概念 仅仅 针对 函数 的 调用 。 这 种 理念 是 让 调用 者 通过 函数 调用 中 的 参数 名 字 来 区 
分 参数 。 这 样 规范 允许 参数 缺失 或 者 不 按 顺 序 , 因为 解释 器 能 通过 给 出 的 关键 字 来 匹配 参数 的 值 。 

















举 个 简单 的 例子 , 比如 有 一 个 函数 foo 0 , 伪 代 码 如 下 : 


def foo(x): 
foo suite # presumably does some processing with °x’ 


标准 调用 foo0 :foo (42) foo( bar’ ) foo(y) 
关键 字 调 用 fool) :foo (x=42) foo(x-' bar’) foo(x-y) 








再 举 个 更 实际 的 例子 ， 假 设 你 有 一 个 函数 叫做 net. conn 0 , 需要 两 个 参数 host 和 port: 





def net conn(host, port): 
net conn suite 








只 要 按照 函数 声明 中 参数 定义 的 顺序 ， 输 入 恰当 的 参数 ， 自 然 就 可 以 调用 这 个 函数 : 


net conn( kappa', 8080) 





host 参数 得 到 字符 串 kappa’ , port 参数 得 到 整数 8080. 当然 也 可 以 不 按照 函数 声明 中 的 参数 顺 
序 输入 ， 但 是 要 输入 相应 的 参数 名 , 如 下 例 : 
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net conn(port-8080, host= chino’) 











当 参 数 允 许 “ 缺 失 “ 的 时 候 ， 也 可 以 使 用 关键 字 参 数 . 这 取决 于 函数 的 默认 参数 ， 我 们 将 在 下 一 
小 节 对 它 进行 介绍 。 


11.2.3. 默认 参数 


默认 参数 就 是 声明 了 默认 值 的 参数 。 因 为 给 参数 赋予 了 默认 值 ， 所 以 ， 在 函数 调用 时 ， 不 向 该 
参数 传 入 值 也 是 允许 的 。 我 们 将 在 11. 5. 2 章 对 默认 参数 进行 更 全 面 的 介绍 。 














11. 2. 4. 参数 组 





Python 同样 允许 程 序 员 执 行 一 个 没有 显 式 定 义 参 数 的 函数 ， 相 应 的 方法 是 通过 一 个 把 元 组 〈 非 
关键 字 

参数 ) 或 字典 (关键 字 参 数 ) 作为 参数 组 传递 给 函数 。 我 们 将 在 本 章 中 讨论 这 两 种 形式 。 基 本 
上 ， 你 可 以 将 所 有 参数 放 进 一 个 元 组 或 者 字典 中 ， 仅 仅 用 这 些 装 有 参数 的 容器 来 调用 一 个 函数 ， 而 


不 必 显 式 地 将 它们 放 在 函数 调用 中 : 
func (*tuple grp nonkw args, **dict grp kw args) 


其 中 的 tuple grp nonkw args 是 以 元 组 形式 体现 的 非 关 键 字 参数 组 ，dict_grp_kw_args 是 装 有 
关键 字 参 数 的 字典 。 正 如 我 们 已 经 提 到 的 , 我 们 将 在 这 章 对 这 两 者 进行 全 面 介绍 , 现在 你 只 需 知道 ， 
存在 这 样 的 特性 允许 你 把 变量 放 在 元 组 和 /或 者 字典 里 ， 并 在 没有 显 式 地 对 参数 进行 逐个 声明 的 情况 
下 ， 调 用 函数 。 



































实际 上 ， 你 也 可 以 给 出 形 参 ! 这 些 参数 包括 标准 的 位 置 参数 和 关键 字 参 数 ， 所 以 在 python 中 多 
许 的 函数 调用 的 完整 语法 为 : 





func(positional args, keyword args, 
*tuple grp nonkw args, **dict grp kw args) 





该 语法 中 的 所 有 的 参数 都 是 可 选 的 一 -从 参数 传递 到 函数 的 过 程 来 看 ， 在 单独 的 函数 调用 时 ， 每 
个 参数 都 是 独立 的 。 这 可 以 有 效 地 取代 applyO AeA. (Prior to Python 1.6, such argument 
objects could only be passed to apply() with the function object for invocation. ) (Œ Python 
1. 6 版 本 之 前 ， 这 样 的 参数 对 象 只 能 通过 apply O 函数 来 调用 ) 。 














例子 
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在 子 11.1 里 的 数学 游戏 中 ， 我 们 用 函数 调用 转换 来 生成 一 个 有 两 个 子 项 的 参数 列表 ， 并 把 这 个 
列表 发 送 给 合 的 适 算术 函数 . (我 们 也 会 指出 在 原来 版 本 中 哪些 地 方 会 用 到 apply O) 











easyMath. py 程序 是 一 个 儿童 算术 游戏 ， 可 以 随机 选择 算术 加 减法 。 我 们 通过 函数 add, sub () 
等 价 +- 运 算 符 ， 这 两 者 都 可 以 在 operator 模块 中 找到 。 接 着 我 们 生成 一 个 参数 列表 该 列表 只 有 2 
个 参数 ， 因 为 这 些 是 二 元 运算 符 / 运 算 )。 接 着 选择 任意 的 数字 作为 算 子 。 因 为 我 们 没 打算 在 这 个 程 
序 的 基础 版 本 中 支持 负数 ， 所 以 我 们 将 两 个 数字 的 列表 按 从 大 到 小 的 顺序 排序 ， 然 后 用 这 个 参数 列 
表 和 随机 选择 的 算术 运算 符 去 调用 相对 应 的 函数 ， 最 后 获得 问题 的 正确 解答 。 























例子 11. 1 算术 游戏 (easyMath. py) 





随机 选择 数字 以 及 一 个 算术 函数 ， 显 示 问 题 ， 以 及 验证 结果 . 在 3 次 错误 的 尝试 以 后 给 出 结果 ， 
等 到 用 户 输入 一 个 正确 的 答案 后 便 会 继续 运行 . 























7 #l/fusr/bin/env python 
2 
3 from operator import add, sub 

4 from random Import randint, choice 

5 

6 ops = (l4; add, '"—: sub} 

7 MAXTRIES = 2 

8 

9 def doprob(): 

10 op = choice t+-’) 

11 nums = [randint (1, 10) for i in range (2)J 
12 nums. sort (reverse-True) 

13 ans = ops[op/ (*nums) 

14 pr = 'fíd %s %d =? % (nums(0], op, nums[1]) 


15 oops = 0 
16 while True: 
I7 try: 


18 if int(raw input(pr)) == ans: 
19 print 'correct' 

20 break 

21 if oops == MAXTRIES: 

22 print ‘answer\n%s%d’%(pr, ans) 


23 else: 
24 print “incorrect... try again’ 
25 oops += 1 
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26 except (KeyboardInterrupt, | 

27 E0FError, ValueError): 

28 print 'invalid input... try again’ 
29 

30 def main0: 

31 while True: 

32 doprob() 

33 try: 

34 opt = raw input( Again? [y] ). lower Q 
35 if opt and opt[0] == "25 

36 break 

37 except (KeyboardInterrupt, EOFError): 
38 break 

39 

40 if name ==’ main 

41 main() 








逐 行 解释 


Lines 1- 4 
我 们 的 代码 从 通常 的 unix 启动 行 开 始 ， 接 着 从 operator 和 random 模块 中 ， 导 入 我 们 会 用 到 
的 函数 。 


Lines 6-7 

在 这 个 应 用 程序 中 我 们 用 的 全 局 变量 有 :一 个 包含 了 运算 符 和 与 其 相关 联 的 函数 的 集合 (字典 ) ， 
一 个 决定 在 给 出 正解 之 前 ， 用 户 有 多 少 次 机 会 尝试 给 出 答案 的 整 型 变量 。 函 数字 典 的 键 值 是 运算 符 
的 符号 ， 程 序 通 过 查 字典 找到 合适 的 算术 函数 。 



































Lines 9- 28 

doprob 0 函数 是 应 用 程序 的 核心 引擎 。 该 函数 随机 选择 一 个 操作 并 生成 两 个 操作 数 ， 同 时 为 了 
避免 减法 问题 中 的 负数 问题 ， 将 这 两 个 算 子 按 大 到 下 进行 排序 。 然 后 用 这 些 值 调用 一 个 数学 函数 ， 
计算 出 正确 的 解 。 接 着 用 一 个 等 式 来 提示 用 户 输入 并 给 用 户 三 次 机 会 来 输入 一 个 正确 的 答案 。 


















































第 十 行 用 了 random. choice O 函数 。 它 用 于 获取 一 个 序列 -一 -我 们 案例 中 运算 符号 的 字符 串 
并 随机 返回 其 中 的 元 素 。 





第 11 行 用 了 一 个 列表 解析 来 随机 地 给 我 们 的 练习 选择 两 个 数 。 这 个 例子 非常 的 简单 以 至 于 我 们 
可 以 仅仅 用 两 次 randint 0 来 获得 我 们 的 操作 数 ， 比 如 ，nums = [randint (1, 10), randint (1, 10)], 
但 是 为 了 让 你 能 看 看 列表 解析 的 又 一 个 例子 ， 我 们 没有 这 样 做 ， 而 且 使 用 列表 解析 更 易于 扩展 和 升 
级 ， 比 如 获得 更 多 的 数 ， 这 与 我 们 使 用 循环 来 代替 前 切 和 粘贴 的 原因 相似 。 
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第 12 行 只 能 在 python2. 4 以 及 更 新 的 版 本 中 运行 , 因为 list. sort 0 方法 原本 不 文 持 倒转 的 标志 
位 。 如 果 你 使 用 的 是 更 早 一 点 的 python WAE, MEA: 








e 增加 一 个 反 序 的 比较 函数 来 获得 倒转 的 排序 ， 如 : lambda x, y: cmp(y, x), EB 


€ ££ nuns. sort() 后 调用 nums. reverse () 





如 果 你 之 前 没有 看 见 过 lampda， 不 用 害怕 。 我 们 会 在 这 章 对 lambda 进行 详 述 ， 而 现在 ， 你 可 以 
认为 它 是 一 个 单行 的 匿名 函数 。 








如 果 你 正 使 用 1.6 以 前 的 python， 那 第 13 行 是 可 能 会 用 到 apply O 。 对 合适 运算 函数 的 调用 要 
这 样 写 apply(ops[op], nums)， 而 不 是 ops[op] Gknums) 











16-28 行 描述 了 用 来 处 理 有 效 和 无 效 输入 的 控制 循环 。while 循环 是 无 限 循 环 ， 直 到 有 正确 答案 
输入 或 者 允许 党 试 的 次 数 〈 我 们 的 程序 中 设 定 为 3 UO 被 耗 尽 才 终 止 运行 。 这 人 允许 程序 接受 不 合法 
的 输入 , 比如 非 数 字 或 者 各 种 键盘 的 控制 字符 。 一 旦 用 户 超过 了 尝试 最 大 的 次 数 ， 程 序 就 会 给 出 答案 
并 “强制 “用 户 给 出 正确 的 答案 ， 只 有 给 出 答案 ， 程 序 才 会 向 下 进行 。 

































































Lines 30-41 
A 程序 的 主 入 口 是 main() ， 如 果 直 接 运行 脚本 ， 程 序 将 自 顶 向 下 的 运行 。 如 果 被 作为 模块 导入 ， 
T 导入 者 要 么 调用 doprob O 函数 来 开始 执行 ， 要 么 调用 main () 来 进入 程序 控制 。main O 简单 地 调用 
doprob () 使 用 户 与 脚本 的 主要 功能 进行 交互 ， 并 负责 提示 用 户 退出 或 者 尝试 下 一 个 问题 。 











因为 数值 和 运算 符 都 是 随机 选择 的 ， 每 次 运行 easyMath.py 的 结果 应 该 都 是 不 一 样 的 。 这 是 我 
们 今天 的 得 到 的 〈 噢 ， 你 的 答案 也 可 能 不 一 样 !110) : 


$ easyMath. py 
7- 2 = 5 correct Again? [y] 
7 * 6 = 42 correct Again? [y] 


/* 3-20 
incorrect... try again 
7 * 3 = 22 
Incorrect... try again 
7 * 3 = 28 
sorry... the answer is 
/*3- 2l 


7 x 3 = 21 correct Again? [y] 
7-8 = 2 correct Again? [y] n 
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11.3 创建 函数 
11.3.1. def 语句 








函数 是 用 def 语句 来 创建 的 ， 语 法 如 下 : 


def function name (arguments): 
“function documentation string” 
function body suite 


标题 行 由 def KES, PR. DEA SES ORAK 组 成 。def 子 句 的 剩余 部 分 
包括 了 一 个 虽然 可 选 但 是 强烈 推荐 的 文档 字 串 ， 和 必需 的 函数 体 。 在 本 书 中 我 们 已 经 看 到 很 多 函数 
的 声明 ， 这 又 是 一 个 : 














def helloSomeone (who) : 
'returns a salutory string customized with the input’ 
return “Hello ^ + str (who) 


11. 3. 2. 声明 与 定义 比较 





在 某 些 编程 语言 里 ， 函 数 声明 和 函数 定义 区 分 开 的 。 一 个 函数 声明 包括 提供 对 函数 名 ， 参 数 的 
名 字 ( 传 统 上 还 有 参数 的 类 型 ), 但 不 必 给 出 函数 的 任何 代码 , 具体 的 代码 通常 属于 函数 定义 的 范畴 。 

在 声明 和 定义 有 区 别 的 语言 中 , 往往 是 因为 函数 的 定义 可 能 和 其 声明 放 在 不 同 的 文件 中 。python 
将 这 两 者 视 为 一 体 ， 函 数 的 子 句 由 声明 的 标题 行 以 及 随后 的 定义 体 组 成 的 。 























11.3.3 前 向 引用 





和 其 他 高 级 语言 类 似 , Python 也 不 允许 在 函数 未 声明 之 前 , 对 其 进行 引用 或 者 调用 . 
我 们 下 面 给 出 几 个 例子 来 看 一 下 : 





def foo(): 
print 'in foo" 
bar () 


如 果 我 们 调用 函数 foo O , 肯定 会 失败 , 因为 函数 bar 0 还 没有 声明 : 


22» foo0 
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in foo() 

Traceback (innermost last): File ^Xstdin^^, line l, in ? 
File ^«stdin^^, line 3, in foo 

NameError: bar 





我 们 现在 定义 函数 bar O ,在 函数 foo (前 给 出 bar O 的 声明 : 


def bar(): 
print 'in bar(Q)’ 


def foo(): 

print 'in foo" 

bar () 

现在 我 们 可 以 安全 的 调用 foo O , 而 不 会 出 现任 何 问题 : 


2» fool in fooQ in bar Q 





事实 上 , 我 们 甚至 可 以 在 函数 bar O 前 定义 函数 foo O : 
: def foo(): : 
print 'in foo" 
bar () 


def bar(): 
print 'in bar(Q)’ 


太 神 奇 了 , 这 段 代 码 可 以 非常 好 的 运行 , 不 会 有 前 向 引用 的 问题 : 





222 fool 
in foo() in bar Q 








这 段 代 码 是 正确 的 因为 即使 (在 foo O "PX bar 0 进行 的 调用 出 现在 bar O 的 定义 之 前 ,但 foo O 
本 身 不 是 在 bar Q 声明 之 前 被 调用 的 。 换 名 话说 ,我 们 声明 foo O ,然后 再 声明 bar () ,接着 调用 foo), 
但 是 到 那 时 ，bar O 已 经 存在 了 ， 所 以 调用 成 功 。 














注意 foo O 在 没有 错误 的 情况 下 成 功 输出 了 ' in foo0 。 名 字 错 误 是 当 访 问 没有 初始 化 的 标识 符 
时 才 产 生 的 异常 
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11. 3. 4. 函数 属性 


在 这 一 章 中 ， 我 们 稍 后 将 对 命名 空间 进行 简短 的 讨论 ， 尤 其 是 它们 与 变量 作用 域 的 关系 。 在 下 
一 章 中 会 有 对 命名 空间 的 更 深入 的 探讨 ,然而 ,这 里 我 们 只 是 想 要 指出 py thon 名 字 空 间 的 基本 特征 。 














你 可 以 获得 每 个 pyhon 模块 ， 类 ， 和 函数 中 任意 的 名 字 空 间 。 你 可 以 在 模块 foo 和 bar 里 都 有 
名 为 x 的 一 个 变量 , ， 但 是 在 将 这 两 个 模块 导入 你 的 程序 后 ， 仍 然 可 以 使 用 这 两 个 变量 。 所 以 ， 即 使 
在 两 个 模块 中 使 用 了 相同 的 变量 名 字 ， 这 也 是 安全 的 ， 因 为 句点 属性 标识 对 于 两 个 模块 意味 了 不 同 
的 命名 空间 ， 比 如 说 ， 在 这 段 代码 中 没有 名 字 冲 突 : 











Import foo, bar 
print foo.x + bar.x 


函数 属性 是 python 另外 一 个 使 用 了 句点 属性 标识 并 拥有 名 字 空 间 的 领域 。( 更 多 关于 名 字 空 间 
将 在 本 章 的 稍 后 部 分 以 及 第 12 章 关 于 python 的 模块 中 进行 讨论 ) 











def foo(): 
'foo() — properly created doc string’ 


def bar(): 


pass 


bar. doc = 'Üops, forgot the doc str above’ 


bar. version = 0.1 








上 面 的 fooO 中 ， 我 们 以 常规 地 方式 创建 了 我 们 的 文档 字 串 ， 比 如 ， 在 函数 声明 后 第 一 个 没有 
赋值 的 字 串 。 当 声明 bar O 时 , 我 们 什么 都 没 做 , 仅 用 了 句点 属性 标识 来 增加 文档 字 串 以 及 其 他 属性 。 
我 们 可 以 接着 任意 地 访问 属性 。 下 面 是 一 个 使 用 了 交互 解释 器 的 例子 。《〈 你 可 能 已 经 发 现 ， 用 内 建 函 
数 help () 显示 会 比 用 _doc ”属性 更 漂亮 ， 但 是 你 可 以 选择 你 喜欢 的 方式 ) 




















—— 











22^ help (foo) 
Help on function foo in module | main : 


foo () 
foo() — properly created doc string 
222 print bar. version 


0. 1 
25^ print foo. doc . 
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foo() — properly created doc string 


225^ print bar. doc . 
Oops, forgot the doc str above 











注意 我 们 是 如 何在 函数 声明 外 定义 一 个 文档 字 串 。 然 而 我 们 仍然 可 以 就 像 平 常 一 样 ， 在 运行 时 
刻 访问 它 。 然 而 你 不 能 在 函数 的 声明 中 访问 属性 。 换 句 话 说， 在 函数 声明 中 没有 self “这样 的 东西 
让 你 可 以 进行 诸如 _dict_ ['version' ] = 0.1 的 赋值 。 这 是 因为 函数 体 还 没有 被 创建 ， 但 之 后 你 有 
了 函数 对 象 ， 就 可 以 按 我 们 在 上 面 描述 的 那样 方法 来 访问 它 的 字典 。 另 外 一 个 自由 的 名 字 空 间 ! 









































函数 属性 是 在 2. 1 中 添加 到 python 中 的 ， 你 可 以 在 PEP232 中 阅读 到 更 多 相关 信息 。 


11. 3. 5 A X/A REL 








FE E US PY EE 3 Sb PR OD RR) ETE ATE «OAH AICTE ABA B/S RESI. BAME 
python x fp ASH CE 2. 1 中 引入 但 是 到 2. 2 INA ED, VI SEERCSE ES ETBUGE AI. Aik 
函数 对 于 较 老 的 python 版 本 没有 什么 意义 ， 那 些 版 本 中 只 支持 全 局 和 一 个 局 部 域 。 那 么 如 何 去 创 造 
AA REZE? 

最 明显 的 创造 内 部 函数 的 方法 是 在 外 部 函数 的 定义 体内 定义 函数 (用 def 关键 字 )， 如 在 : 


def foo(): 
def bar(): 
print 'bar() called’ 


print 'foo() called' 
bar () 




















foo () 
bar () 
我 们 将 以 上 代码 置 入 一 个 模块 中 ， 如 inner. py， 然 后 运行 ， 我 们 会 得 到 如 下 输出 : 


foo() called bar() called 
Traceback (most recent call last): File “inner. py”, line 1L in ? 
bar () 


NameError: name 'bar' is not defined 


内 部 函数 一 个 有 趣 的 方面 在 于 整个 函数 体 都 在 外 部 函数 的 作用 域 〈 即 是 你 可 以 访问 一 个 对 象 的 
ik; 稍 后 会 有 更 多 关于 作用 域 的 介绍 ) 之 内 。 如 果 没 有 任何 对 bar O 的 外 部 引用 ,那么 除了 在 函数 
体内 ， 任 何 地 方 都 不 能 对 其 进行 调用 ， 这 就 是 在 上 述 代 码 执行 到 最 后 你 看 到 异常 的 原因 




















另外 一 个 函数 体内 创建 函数 对 象 的 方式 是 使 用 lambda 语句 。 我 们 会 在 稍 后 的 11. 7. 1 小 节 进 行 
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讲述 。 如 果 内 部 函数 的 定义 包含 了 在 外 部 函数 里 定义 的 对 象 的 引用 (这 个 对 象 甚至 可 以 是 在 外 部 函 
数 之 外 )， 内 部 函数 会 变 成 被 称 为 财 包 〈closure) 的 特别 之 物 。 在 接 下 来 的 11.8. 4 小节， 我 们 将 对 
闭 包 进行 更 多 的 学 习 。 在 下 一 小 节 中 ， 我 们 将 介绍 装饰 器 ， 但 是 例子 程序 也 包含 了 闭 包 的 预览 。 





11.3. 6 xK% (CSD) 装饰 器 





装饰 器 背后 的 主要 动机 源 自 python 面向 对 象 编程 。 装 饰 器 是 在 函数 调用 之 上 的 修饰 。 这 些 修饰 
仅 是 当 声 明 一 个 函数 或 者 方法 的 时 候 ， 才 会 应 用 的 额外 调用 。 








装饰 器 的 语法 以 6 开头 ， 接 着 是 装饰 器 函数 的 名 字 和 可 选 的 参数 。 紧 跟着 装饰 器 声明 的 是 被 修饰 
的 函数 ， 和 装饰 函数 的 可 选 参数 。 装 饰 器 看 起 来 会 是 这 样 : 








@decorator (dec opt args) 
def func2Bdecorated (func opt args): 








那么 装饰 器 语法 如 何 〈 以 及 为 什么 ) 产生 的 呢 ? 装饰 器 背后 的 灵感 是 什么 ? 唔 ， 当 静态 方法 和 
类 方法 在 2. 2 时 被 加 入 到 python PHR, KMAR E: 


. class MyClass (object): 
def staticFoo(): 


staticFoo = staticmethod (staticFoo) 

















GE TG T8 IAL TBR ATMA, PE MAMN IIE) 在 这 个 类 的 声明 中 ， 我 们 定义 了 叫 
staticFoo () 的 方法 。 现 在 因为 打算 让 它 成 为 静态 方法 ， 我 们 省 去 它 的 self 参数 ， 而 你 会 在 12 章 中 
看 到 ，self 参数 在 标准 的 类 方法 中 是 必需 的 。 接 着 用 staticmethod O 内 建 函数 来 将 这 个 函数 “转化 
“为 静态 方法 ， 但 是 在 def staticFoo 0 后 跟着 staticFoo = staticmethod (sta- ticFoo) 显得 有 
多 么 的 腑 肿 。 使 用 装饰 器 ， 你 现在 可 以 用 如 下 代码 蔡 换 掉 上 面 的 ; 














class MyClass (object): 
@staticmethod 
def staticFoo(): 


Veoh, elias Ay DAU eg OUS FH — RE HES “ROR, KA SEE BI, EH Y TRE 

















Edit By Vheavens 


Edit By Vheavens 


ee 
T | 


@deco2 
@decol 
def func(argl, arg2, ...): pass 


这 和 创建 一 个 组 合 函数 是 等 价 的 。 











def func (argl, arg2, ...J: pass 

func = decoZ(decol (func)) 

函数 组 合用 数学 来 定义 就 像 这 样 : (g * f) (x) = g(f(x))。 对 于 在 python 中 的 一 致 性 
üg 

Qf 

def foo(): 


nee 与 foo=g (f (foo) ) 4H [n] 


有 参数 和 无 参数 的 装饰 器 








是 的 ， 装 饰 器 语法 一 开始 有 点 让 你 犯 迷 糊 ， 但 是 一 旦 你 适应 了 ， 唯 一 会 困扰 你 的 就 是 什么 时 候 
使 用 带 参 数 的 装饰 器 。 没 有 参数 的 情况 ， 一 个 装饰 器 如 ; 








@deco 
def foo(): pass 


... .非常 的 直接 
foo = deco(foo) 


跟着 是 无 参 函 数 (如 上 面 所 见 ) 组 成 。 然 而 ， 带 参数 的 装饰 器 decomaker () 





@decomaker (deco args) 
def foo(): pass 








需要 自己 返回 以 函数 作为 参数 的 装饰 器 。 换 名 话说 ，decomaker () Hl deco args 做 了 些 事 并 返回 
函数 对 象 ， 而 该 函数 对 象 正 是 以 foo 作为 其 参数 的 装饰 器 。 简 单 的 说 来 : 


foo = decomaker(deco args) (foo) 


这 里 有 一 个 含有 多 个 装饰 器 的 例子 ， 其 中 的 一 个 装饰 器 带 有 一 个 参数 
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@decol (deco arg) 

@deco2 

def func Q: pass 

This is equivalent to: 这 等 价 于 : 





func = decol(deco arg) (deco2 (func)) 
我 们 希望 如 果 你 明白 这 里 的 这 些 例子 ， 那 么 事情 就 变 得 更 加 清楚 了 。 下 面 我 们 会 给 出 简单 实用 
的 脚本 ， 该 脚本 中 装饰 器 不 带 任何 参数 。 例 子 11. 8 就 是 含有 无 参 装 饰 器 的 中 间 脚 本 。 





那么 什么 是 装饰 器 ? 








现在 我 们 知道 装饰 器 实际 就 是 函数 。 我 们 也 知道 他 们 接受 函数 对 象 。 但 它们 是 怎样 处 理 那些 函 
数 的 呢 ? 一 般 说 来 ， 当 你 包装 一 个 函数 的 时 候 ， 你 最 终 会 调用 它 。 最 棒 的 是 我 们 能 在 包装 的 环境 下 
在 合适 的 时 机 调用 它 。 我 们 在 执行 函数 之 前 ， 可 以 运行 些 预备 代码 ， 如 post-morrem 分 析 , 也 可 以 在 
执行 代码 之 后 做 些 清理 工作 。 所 以 当 你 看 见 一 个 装饰 器 函数 的 时 候 ， 很 可 能 在 里 面 找到 这 样 一 些 代 
15, 它 定 义 了 某 个 函数 并 在 定义 内 的 某 处 嵌入 了 对 目标 函数 的 调用 或 者 至 少 一 些 引用 。 从 本 质 上 看 ， 
这 些 特征 引入 了 java 开发 者 称呼 之 为 AOP (Aspect Oriented Programming, 面向 方面 编程 ) 的 概念 。 
你 可 以 考虑 在 装饰 器 中 置 入 通用 功能 的 代码 来 降低 程序 复杂 度 。 例 如 ， 可 以 用 装饰 器 来 : 



































e 引入 日 志 
e 增加 计时 逻辑 来 检测 性 能 
e 给 函数 加 入 事务 的 能 








对 于 用 python 创建 企业 级 应 用 ， 支 持 装 饰 器 的 特性 是 非常 重要 的 。 你 将 会 看 到 上 面 的 条 例 与 我 
们 下 面 的 例子 有 非常 紧密 地 联系 ， 这 在 例 11.2 中 也 得 到 了 很 好 地 体现 。 








修饰 符 举 例 


下 面 我 们 有 个 极其 简单 的 例子 ， 但 是 它 应 该 能 让 你 开始 真正 地 了 解 装 饰 器 是 如 何 工 作 的 。 这 个 
例子 通过 显示 函数 执行 的 时 间 “ 闭 饰 * 了 一 个 (没有 用 的 ) PR REN I I”, GRITE 16 
章 讨论 的 时 戴 服 务 器 非常 相似 。 








例子 11.2 使 用 函数 装饰 器 的 例子 (deco. py) 


这 个 装饰 器 《以 及 闭 包 ) 示范 表明 装饰 器 仅仅 是 用 来 “装饰 “( 或 者 修饰 ) 函数 的 包装 ， 返 回 一 
个 修改 后 的 函数 对 象 ， 将 其 重新 赋值 原来 的 标识 符 ， 并 永久 失去 对 原始 函数 对 象 的 访问 。 








7 #//usr/bin/env python 
2 
3 from time import ctime, sleep 
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5 def tsfunc (func): 

6 def wrappedFunc Q : 

7 print ’ [%s] fis) called’ % ( 
8 ctime(), func. name ) 





9 return func () 

10 return wrappedFunc 
11 

12 @tsfunc 

13 def foo(): 

14 pass 

15 

16 foo() 

17 sleep (4) 

18 

19 for i in range (2) : 
20 sleep (1) 

21 foo() 


运行 脚本 ， 我 们 得 到 如 下 输出 : 


[Sun Mar 19 22:50:28 2006] foo) called 

[Sun Mar 19 22:50:33 2006] foo called 
[Sun Mar 19 22:50:34 2006] foo called 
逐 行 解释 


5-10 行 

在 启动 和 模块 导入 代码 之 后 ， tsfunc 0 函数 是 一 个 显示 何 时 调用 函数 的 时 截 的 装饰 器 。 它 定义 
了 一 个 内 部 的 函数 wrappedFunc 0 ， 该 函数 增加 了 时 改 以 及 调用 了 目标 函数 。 装 饰 器 的 返回 值 是 一 个 
“包装 了 “的 函数 。 








Lines 12-21 
我 们 用 空 函 数 体 (什么 都 不 做 ) 来 定义 了 foo O 函数 并 用 tsfunc 0 〇 来 装饰 。 为 证 明 我 们 的 设想 ， 
立刻 调用 它 ， 然 后 等 待 四 秒 ， 然 后 再 调用 两 次 ， 并 在 每 次 调用 前 暂停 一 秒 。 











结果 ， 函 数 立 刻 被 调用 ， 第 一 次 调用 后 ， 调 用 函数 的 第 二 个 时 间 点 应 该 为 5 〈4+1)， 第 三 次 的 时 
间 应 该 大 约 为 之 后 的 1 秒 。 这 与 上 面 看 见 的 函数 输出 十 分 吻合 。 





你 可 以 在 python langugae reference, python2.4 P “What? s New in Python 2.4” 的 文档 
以 及 PEP 318 中 来 阅读 更 多 关于 装饰 器 的 内 容 。 





$— 一 * 一 
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11. 4 传递 函数 





当 学 习 一 门 如 C 的 语言 时 ， 函 数 指针 的 概念 是 一 个 高 级 话题 ， 但 是 对 于 函数 就 像 其 他 对 象 的 
python 来 说 就 不 是 那么 回 事 了 . 函数 是 可 以 被 引用 的 《访问 或 者 以 其 他 变量 作为 其 别名 )， 也 作为 参 
数 传 入 函数 ， 以 及 作为 列表 和 字典 等 等 容器 对 象 的 元 素 





函数 有 一 个 独一无二 的 特征 使 它 同 其 他 对 象 区 分 开 来 ， 那 就 是 函数 是 可 调用 的 。 





举例 来 说 ， 可 以 通过 函数 操作 来 调用 他 们 。( 在 python 中 有 其 他 的 可 调用 对 象 。 更 多 信息 ， 参 
见 14 章 ) 在 以 上 的 描述 中 ， 我 们 注意 到 可 以 用 其 他 的 变量 来 做 作为 函数 的 别名 





因为 所 有 的 对 象 都 是 通过 引用 来 传递 的 ， 函 数 也 不 例外 。 当 对 一 个 变量 赋值 时 ， 实 际 是 将 相同 
对 象 的 引用 赋值 给 这 个 变量 。 如 果 对 象 是 函数 的 话 ， 这 个 对 象 所 有 的 别名 都 是 可 调用 的 。 





2> def foo: 
print 'in foo" 


222 bar = foo 
2» bar 
in foo 


当 我 们 把 foo 赋值 给 bar IN, bar 和 foo 引用 了 同一 个 函数 对 象 ， 所 以 能 以 和 调用 foo O 相同 的 
方式 来 调用 bar () 。 确 定 你 明白 ”foo” (函数 对 象 的 引用 ) W^ foo” (函数 对 象 的 调用 ) 的 区 别 。 




















稍微 深入 下 我 们 引用 的 例子 ， 我 们 甚至 可 以 把 函数 作为 参数 传 入 其 他 函数 来 进行 调用 。 


22^ def bar(argfunc): 
argfunc () 


>> bar (foo) 
in foo 


注意 到 函数 对 象 foo 被 传 入 到 bar Or. bar O EF] f. foo (用 局 部 变量 argfunc 来 作为 其 别名 
就 如 同 在 前 面 的 例子 中 我 们 把 foo IRA bar 一 样 )。 现 在 我 们 来 研究 下 一 个 更 加 实际 的 例子 ， 
numconv. py， 人 代码 在 例子 11.3 中 给 出 














例 11. 3 传递 和 调用 (内 建 ) 函数 


(numConv. py) 
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一 个 将 函数 作为 参数 传递 ， 并 在 函数 体内 调用 这 些 函 数 ， 更 加 实际 的 例子 。 这 个 脚本 用 传 入 的 
转换 函数 简单 将 一 个 序列 的 数 转化 为 相同 的 类 型 。 特 别 地 ，test O 函数 传 入 一 个 内 建 函 数 int O, 
long), zk4f float () 来 执行 转换 。 








l#!/usr/bin/env python 

2 

3def convert (func, seq): 

4’conv. sequence of numbers to same type’ 
5return [func (eachNum) for eachNum in seq] 
6 

7myseq = (123, 45.67, -6.2e8, 999999999L) 
Sprint convert (int, myseq) 

9print convert (long, myseq) 

10 print convert (float, myseq) 


如 果 我 们 运行 这 个 程序 ， 我 们 将 会 得 到 如 下 输出 : 


$ numconv. py 


[123, 45, -620000000, 999999999] 
[123L, 45L, -620000000L, 999999999L] 
[123. 0, 45.67, -620000000. 0, 999999999. 0] 


11.5 形式 参数 








python 函数 的 形 参 集合 由 在 调用 时 要 传 入 函数 的 所 有 参数 组 成 ， 这 参数 与 函数 声明 中 的 参数 列 
表 精 确 的 配对 。 这 些 参数 包括 了 所 有 必要 参数 (以 正确 的 定位 顺序 来 传 入 函数 的 )， 关 键 字 参数 〈 以 
顺序 或 者 不 按 顺 序 传 入， 但 是 带 有 参数 列表 中 曾 定义 过 的 关键 字 )， 以 及 所 有 含有 默认 值 ， 函 数 调用 
时 不 必要 指定 的 参数 。( 声 明 函 数 时 创建 的 ) 局 部 命名 空间 为 各 个 参数 值 ， 创 建 了 一 个 名 字 。 一 旦 函 
数 开始 执行 ， 即 能 访问 这 个 名 字 。 









































11. 5. 1 位 置 参 数 











这 些 我 们 都 是 熟悉 的 标准 化 参数 。 位 置 参数 必须 以 在 被 调用 函数 中 定义 的 准确 顺序 来 传递 。 男 
外 ， 没 有 任何 默认 参数 〈 见 下 一 个 部 分 ) 的话， 传 入 函数 (调用) 的 参数 的 精确 的 数目 必须 和 声明 
的 数字 一 致 。 

















22» def foo(who): # defined for only 1 argument 














Edit By Vheavens 


Edit By Vheavens 


ee 
t | 


print ’Hello’, who 





2» foo) # 0 arguments... BAD Traceback (innermost last): 

File “<stdim”, line L in ? 

TypeError: not enough arguments; expected l, got 0 

225 

2»» fool World!') £ 1 argument... WORKS Hello World! 

225 

2»» foo( Mr. ', "World! )# 2 arguments... BAD Traceback (innermost last): 
File "Xstdin^^, line l, in ? 


TypeError: too many arguments; expected l, got 2 


foo O 函数 有 一 个 位 置 参数 。 那 意味 着 任何 对 foo O 的 调用 必须 有 唯一 的 一 个 参数 , 不 多 , 不 少 。 
否则 你 会 频频 看 到 TypeError。 看 看 ，python 的 错误 是 多 么 具有 信息 性 的 。 作 为 一 个 普遍 的 规则 ， 
无 论 何 时 调用 函数 ， 都 必须 提供 函数 的 所 有 位 置 参 数 。 可 以 不 按 位 置地 将 关键 字 参 数 传 入 函数 ， 给 
出 关键 字 来 匹配 其 在 参数 列表 中 的 合适 的 位 置 是 被 准予 的 (可 以 回顾 11. 2. 2 小 节 ) 





























由 于 默认 参数 的 特质 ， 他 们 是 函数 调用 的 可 选 部 分 。 





11. 5. 2. 默认 参数 





对 于 默认 参数 如 果 在 函数 调用 时 没有 为 参数 提供 值 则 使 用 预先 定义 的 的 默认 值 。 这 些 定义 在 函 
数 声明 的 标题 行 中 给 出 。c++ 也 支持 默认 参数 ， 和 python 有 同样 的 语法 : 参数 名 等 号 默认 值 。 这 个 
从 句法 上 来 表明 如 果 没 有 值 传递 给 那个 参数 ， 那 么 这 个 参数 将 取 默 认 值 。 

python 中 用 默认 值 声 明 变 量 的 语法 是 所 有 的 位 置 参数 必须 出 现在 任何 一 个 默认 参数 之 前 。 

def func(posargs, defargl-dvall, defarg2-dval2,...): 

“function documentation string’ 























function body suite 








每 个 默认 参数 都 紧 跟 着 一 个 用 默认 值 的 赋值 语句 。 如 果 在 函数 调用 时 没有 给 出 值 ， 那 么 这 个 赋 
值 就 会 实现 。 





为 什么 用 默认 参数 ? 











默认 参数 让 程序 的 健壮 性 上 升 到 极 高 的 级 别 ， 因 为 它们 补充 了 标准 位 置 参数 没有 提供 的 一 些 灵 
活性 。 这 种 简洁 极 大 的 帮助 了 程序 员 。 当 少 几 个 需要 操心 的 参数 时 候 ， 生 活 不 再 那么 复杂 。 这 在 一 
个 程序 员 刚 接触 到 一 个 API 接口 时 ， 没 有 足够 的 知识 来 给 参数 提供 更 对 口 的 值 时 显得 尤为 有 帮助 。 

使 用 默认 参数 的 概念 与 在 你 的 电脑 上 安装 软件 的 过 程 类 似 。 一 个 人 会 有 多 少 次 选择 默认 安装 而 
不 是 自 定 义 安 装 ? 我 可 以 说 可 能 几乎 都 是 默认 安装 。 这 既 方 便 ， 易 于 操作 ， 又 能 节省 时 间 。 如 果 你 









































E 





$— E 
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是 那些 总 是 选择 自 定 义 安 装 的 顽固 分 子 ， 请 记 着 你 只 是 少数 人 之 一 











男 外 一 个 让 开发 者 受益 的 地 方 在 于 ， 使 开发 者 更 好 地 控制 为 顾客 开发 的 软件 。 当 提供 了 默认 值 
的 时 候 ， 他 们 可 以 精心 选择 “最 佳 “ 的 默认 值 ， 所 以 用 户 不 需要 马上 面 对 繁 琐 的 选项 。 随 着 时 间 流 
逝 ， 当 用 户 对 系统 或 者 api 越 来 越 熟 悉 的 时 候 ， 他 们 最 终 能 自行 给 出 参数 值 ， 便 不 再 需要 使 用 “学 
步 车 “了 






































下 面 这 个 例子 中 默认 参数 派 得 上 用 场 ， 并 在 日 益 增长 的 电子 商务 中 多 少 有 些 用 处 





225 def 
taxMe (cost, 
rate=0. 0825) : 


return cost 
+ (cost * rate) 


>>> taxMe (100) 


108. 25 
225 
>> taxMe (100, 0. 05) 


105. 0 





在 上 面 个 例子 中 ，taxMe O 函数 以 一 个 项 目的 成 本 输入 参数 ， 计 算出 附加 了 销售 税 的 销售 价格 。 
成 本 是 一 个 必需 的 参数 ， 但 税率 是 一 个 默认 参数 〈 在 我 们 的 例子 中 为 8. 25%)。 或 许 你 是 一 个 在 线 零 
售 商 ， 生 意 上 的 大 部 分 客户 来 自 相 同 的 州 或 者 国家 。 不 同 地 方 税率 的 顾客 期 望 看 见 他 们 与 当地 销售 
税率 相对 应 的 购买 价格 总 量 。 为 了 宪 盖 默认 的 税率 ， 你 所 要 做 的 就 是 提供 一 个 参数 值 ， 比 如 在 上 面 
的 例子 中 的 taxMe (100, 0. 05) 。 通 过 指定 5% 税 率 ， 你 提供 了 一 个 参数 作为 税率 参数 ， 所 以 覆盖 或 者 
说 绕 过 了 0.0825 的 默认 值 。 









































所 有 必需 的 参数 都 要 在 默认 参数 之 前 。 为 什么 ? 简单 说 来 就 是 因为 它们 是 强制 性 的 ， 但 默认 参 
数 不 是 。 从 句法 构成 上 看 ， 对 于 解释 器 来 说 ， 如 果 人 允许 混合 模式 ， 确 定 什么 值 来 匹配 什么 参数 是 不 
可 能 的 。 如 果 没 有 按 正确 的 顺序 给 出 参数 ， 就 会 产生 一 个 语法 错误 。 












































22^ def taxMe2(rate-0. 0825, cost): 
return cost * (1.0 + rate) 


SyntaxError: non-default argument follows default argument 
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IEEE PKEFER, HICÓÉIEMZX net connQ 


def net conn(host, port): 


net conn suite 


读者 应 该 还 记得 ， 如 果 命名 了 参数 ， 这 里 可 以 不 按 顺 序 给 出 参数 。 由 于 有 了 上 述 声 明 ， 我 们 可 
以 做 出 如 下 《规则 的 ) 位 置 或 者 关键 字 参 数 调用 : 




















€ net conn( kappa’, 8000) 
€ net conn(port-8080, host=’ chino’ ) 











然而 ， 如 果 我 们 将 默认 参数 引入 这 个 等 式 ， 情 况 就 会 不 同 ， 虽 然 上 面 的 调用 仍然 有 效 。 让 我 们 
修改 下 net conn O 的 声明 以 使 端口 参数 有 默认 值 80， 再 增加 另外 的 名 为 stype (服务 器 的 类 型 ) 默认 
值 为 “tcp“ 的 参数 : 














def net conn(host, port=80, stype-' tcp’): 


net conn suite 








我 们 已 经 扩展 了 调用 net conn O 的 方式 。 以 下 就 是 所 有 对 net. conn O 有 效 的 调用 
€ net conn( phaze' , 8000, ”udp ) # no def args used 

€ net conn( kappa’) & both def args used 

€ net conn( chino’, stype= icmp’) # use port def arg 

€ net conn(stype- udp’, host-'solo') # use port def arg 

€ net conn( deli’, 8080) & use stype def arg 

€ net conn(port-81, host= chino’) # use stype def arg 





在 上 面 所 有 的 例子 中 , 我 们 发 现 什么 是 一 直 不 变 的 ? 唯一 的 必须 参数 , host. host 没有 默认 值 ， 
所 以 他 必须 出 现在 所 有 对 net conn O 的 调用 中 。 关 键 字 参数 已 经 被 证 明 能 给 不 按 顺 序 的 位 置 参数 提 
供 参 数 ， 结 合 默认 参数 ， 它 们 同样 也 能 被 用 于 跳 过 缺失 参数 ， 上 面 例子 就 是 极 好 的 证 据 。 


























默认 函数 对 象 参数 举例 


我 们 现在 将 给 出 另外 一 个 证 明 默 认 参 数 会 让 人 受益 的 例子 。grabWeb. py 脚本 ， 在 例子 11.4 中 给 
出 ， 是 一 个 主要 目的 是 从 互联 网 上 抓 取 一 个 Web 页 面 并 暂时 储存 到 一 个 本 地 文件 中 用 于 分 析 的 简单 
脚本 。 这 类 程序 能 用 来 测试 web 站 点 页 面 的 完整 性 或 者 能 监测 一 个 服务 器 的 负载 〈 通 过 测量 可 链接 
HERE PRERE). process O 函数 可 以 做 我 们 想 要 的 任何 事 ， 表 现 出 了 无 限 种 的 用 途 。 我 们 为 这 
个 练习 选择 的 用 法 是 显示 从 web 页 面 上 获得 的 第 一 和 最 后 的 非 空 格 行 。 虽 然 在 现实 中 这 个 特别 的 例 
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子 或 许 没有 多 少 用 处 ， 但 是 你 可 以 以 这 段 代码 为 基础 ， 举 一 反 三 。 





例子 抓 取 网 页 


这 段 脚本 下 载 了 一 个 web 页 面 〈 默 认为 本 地 的 www 服务 器 ) 并 显示 了 html 文件 的 第 一 个 以 及 最 
后 一 个 非 空 格 行 。 由 于 download O 函数 的 双 默 认 参 数 允 许 用 不 同 的 urls 或 者 指定 不 同 的 处 理 函数 来 
进行 覆盖 ， 灵 活性 得 倒 了 提高 。 








7 #!/usr/bin/env python 
2 
3 from urllib import urlretrieve 
4 
5 def firstNonBlank (lines): 
6 for eachLine in lines: 
7 if not eachLine. strip): 
ó continue 
9 else: 
10 return eachLine 
11 
12 def firstLast (webpage) : 
13 f = open (webpage) 
14 lines = f. readlines () 
15 f. close 0) 
16 print firstNonBlank (lines), 
17 lines. reverse () 
18 print firstNonBlank (lines), 
19 
20 def download (url= http://www’, 
21 process-firstLast): 
22 try: 
23 retval = urlretrieve (url) [0] 
24 except lÜüError: 
25 retval = None 
26 If retval: # do some processing 
27 process (retval) 
28 
29 if name ==’ main 


30 download () 





在 我 们 的 环境 下 运行 这 个 脚本 会 得 到 如 下 的 输出 ， 虽 然 你 的 内 容 是 绝对 不 同 的 ， 因 为 你 将 浏览 
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一 个 完全 不 同 的 网 页 。 
$ grabWeb. py 


¢<!DOCTYPE HTML PUBLIC °-//W3C//DTD HTML 3.2 Final//EN^» 
</HTML> 


11. 6 可 变 长 度 的 参数 














可 能 会 有 需要 用 函数 处 理 可 变数 量 参数 的 情况 。 这 时 可 使 用 可 变 长 度 的 参数 列表 。 变 长 的 参数 
在 函数 声明 中 不 是 显 式 命 名 的 ， 因 为 参数 的 数目 在 运行 时 之 前 是 未 知 的 《甚至 在 运行 的 期 间 ， 每 次 
函数 调用 的 参数 的 数目 也 可 能 是 不 同 的 )， 这 和 常规 参数 〈 位 置 和 默认 ) 明显 不 同 ， 第 规 参 数 都 是 在 
函数 声明 中 命名 的 。 由 于 函数 调用 提供 了 关键 字 以 及 非 关键 字 两 种 参数 类 型 ，python 用 两 种 方法 来 
支持 变 长 参数 ， 

在 11.2.4 ANE, 我们 了 解 了 在 函数 调用 中 使 用 * 和 ** 符 号 来 指定 元 组 和 字典 的 元 素 作为 非 关 
键 字 以 及 关键 字 参 数 的 方法 。 在 这 个 部 分 中 ， 我 们 将 再 次 使 用 相同 的 符号 ， 但 是 这 次 在 函数 的 声明 
中 , 表示 在 函数 调用 时 接收 这 样 的 参数 。 这 语法 允许 函数 接收 在 函数 声明 中 定义 的 形 参 之 外 的 参数 。 












































11. 6. 1. 非 关 键 字 可 变 长 参数 元 组 ) 


当 函 数 被 调用 的 时 候 ， 所 有 的 形 参 (必须 的 和 默认 的 ) 都 将 值 赋 给 了 在 函数 声明 中 相对 应 的 局 
部 变量 。 剩 下 的 非 关 键 字 参数 按 顺 序 插 入 到 一 个 元 组 中 便于 访问 。 可 能 你 对 C 中 的 “varargs“ 很 熟 
悉 〈 比 如 ，va_list，va_arg, 以 及 省 略 号 [....])。Python 提供 了 与 之 相等 的 支持 --- 迭 代 过 所 有 的 
元 组 元 素 和 在 C 中 用 va arg 是 相同 的 。 对 于 那些 不 熟悉 C 或 者 ”varargs” 的 人 ， 这 仅仅 代表 了 在 函 
数 调用 时 ， 接 受 一 个 不 定 〈 非 固定 ) 数目 的 参数 。 

可 变 长 的 参数 元 组 必须 在 位 置 和 默认 参数 之 后 ， 带 元 组 〈 或 者 非 关键 字 可 变 长 参数 ) 的 函数 普 
遍 的 语法 如 下 : 















































def function name([formal args, ] *vargs tuple): 
“function documentation string’ 
function body suite 





星 号 操作 符 之 后 的 形 参 将 作为 元 组 传递 给 函数 , 元 组 保存 了 所 有 传递 给 函数 的 额外 ”的 参数 ( 匹 
配 了 所 有 位 置 和 具名 参数 后 剩余 的 ) 。 如 果 没 有 给 出 额外 的 参数 ， 元 组 为 空 。 




















正如 我 们 先前 看 见 的 ， 只 要 在 函数 调用 时 给 出 不 正确 的 函数 参数 数目 ， 就 会 产生 一 个 TypeError 
异常 。 通 过 末尾 增加 一 个 可 变 的 参数 列表 变量 , 我 们 就 能 处 理 当 超 出 数目 的 参数 被 传 入 函数 的 情形 ， 
因为 所 有 的 额外 《〈 非 关键 字 ) 参数 会 被 添加 到 变量 参数 元 组 。( 额 外 的 关键 字 参 数 需要 关键 字 变量 参 
数 [参见 下 一 小 节 ].) 正 如 预料 的 那样 ， 由 于 和 位 置 参数 必须 放 在 关键 字 参 数 之 前 一 样 的 原因 ， 上 所 有 
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的 形式 参数 必须 先 于 非 正 式 的 参数 之 前 出 现 。 





def tupleVarArgs(argl, argZ-'defaultB', *theRest): 

'display regular args and non-keyword variable args' 

print 'formal arg 1:', argl print 'formal arg 2:', argl for eachXtrArg in theRest: 
print 'another arg:', eachXtrArg 


我 们 现在 调用 这 个 函数 来 说 明 可 变 参 数 元 组 是 如 何 工作 的 。 


2> tupleVarArgs ( abc’) 
formal arg 1: abc 

formal arg 2: defaultB 
p 

2^» tupleVarArgs (23, 4. 56) 
formal arg 1: 23 

formal arg 2: 4.56 

p 

> tupleVarArgs( abc’, 123, 'xyz', 456. 789) 
formal arg 1: abc 

formal arg 2: 123 
another arg: xyz 

another arg: 456. 789 


11. 6. 2. 关键 字 变量 参数 (Dictionary) 


在 我 们 有 不 定数 目的 或 者 额外 集合 的 关键 字 的 情况 中 ， 参数 被 放 入 一 个 字典 中 ， 字 典 中 键 为 参 
数 名 ， 值 为 相应 的 参数 值 。 为 什么 一 定 要 是 字典 呢 ? 因 为 为 每 个 参数 -参数 的 名 字 和 参数 值 -- 都 是 成 
对 给 出 一 -用 字典 来 保存 这 些 参数 自然 就 最 适合 不 过 了 。 



































这 给 出 使 用 了 变量 参数 字典 来 应 对 额外 关键 字 参 数 的 函数 定义 的 语法 : 


def function name([formal args, l[*vargst, | **vargsd): 
function documentation string function body suite 














为 了 区 分 关键 字 参 数 和 非 关 键 字 非 正 式 参 数 ， 使 用 了 双星 写 〈**)。 兰 是 被 重 载 了 的 以 便 不 与 
窜 运 算 发 生 混淆 。 关 键 字 变量 参数 应 该 为 函数 定义 的 最 后 一 个 参数 ， 带 **#。 我 们 现在 展示 一 个 如 何 
使 用 字典 的 例子 : 





























def dictVarArgs(argl, arg2- defaultB', **theRest): 
'display 2 regular args and keyword variable args' 
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print 'formal argl:', argl 





print 'formal arg2:', arg2 

for eachXtrArg in theRest. keys: 
print 'Xtra arg Ws: “s? % | 
(eachXtrArg, str(theRest[eachXtrArg/)) 


在 解释 器 中 执行 这 个 代码 ， 我 们 得 到 以 下 输出 。 


>>> dictVarArgs(1220, 740.0, c= grail’) 
formal argl: 1220 
formal arg2: 740.0 
Xtra arg c: grail 
>>> 
>>> dictVarArgs(arg2-' tales’, c-123, d= poe’, argl-' mystery’ ) 
formal argl: mystery 
formal arg2: tales 
Xtra arg c: 123 
Xtra arg d: poe 
>>> 
>>> dictVarArgs( one’, d=10, e= zoo’, men=( freud’, ’ gaudi’ )) 
formal argl: one 
formal arg2: defaultB 
Xtra arg men: ( freud’, 'gaudi') 
Xtra arg d: 10 
Xtra arg e: zoo 

















关键 字 和 非 关 键 字 可 变 长 参数 都 有 可 能 用 在 同一 个 函数 中 ， 只 要 关键 字 字典 是 最 后 一 个 参数 并 
且 非 关键 字 元 组 先 于 它 之 前 出 现 ， 正 如 在 如 下 例子 中 的 一 样 : 





def newfoo(argl, argZ, *nkw, **kw): 

display regular args and all variable args’ 

print 'argl is:', argl print 'arg2 is:', arg2 for eachNKW in nkw: 
print 'additional non-keyword arg:', eachNKW 

for eachKW in kw.keys: 

print “additional keyword arg 'fs': fs^ % | 

(eachKW, kw[eachKW]) 


在 解释 器 中 调用 我 们 的 函数 ， 我 们 得 到 如 下 的 输出 : 


22» newfoo( wolf’, 3, 'projects', freud-90, gamble=96) 
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argl is: wolf arg? is: 8 





additional non-keyword arg: projects 
additional keyword arg 'freud': 90 
additional keyword arg 'gamble': 96 


11.6.3 调用 带 有 可 变 长 参数 对 象 函数 





在 上 面 的 11.2.4 部 分 中 ， 我 们 介绍 了 在 函数 调用 中 使 用 * 和 ** 来 指定 参数 集合 。 接 下 来 带 着 对 
函数 接受 变 长 参数 的 些许 偏见 ， 我 们 会 向 你 展示 更 多 那 种 语法 的 例子 ， 








我 们 现在 将 用 在 前 面部 分 定义 的 ， 我 们 的 老 朋 友 newfoo 0 ， 来 测试 新 的 调用 语法 。 我 们 第 一 个 
对 newfoo O 的 调用 将 会 使 用 旧 风 格 的 方式 来 分 别 列 出 所 有 的 参数 ， 甚 至 跟 在 所 有 形式 参数 之 后 的 变 
长 参数 : 








22^ newfoo(10, 20, 30, 40, foo-50, bar=60) 
argl is: 10 

arg? is: 20 

additional non-keyword arg: 30 
additional non-keyword arg: 40 
additional keyword arg 'foo': 50 
additional keyword arg 'bar': 60 








我 们 现在 进行 相似 的 调用 ; 然而 ， 我 们 将 非 关 键 字 参数 放 在 元 组 中 将 关键 字 参 数 放 在 字典 中 ， 
而 不 是 逐个 列 出 变量 参数 : 


22^ newfoo(2, 4, *(6, 8), **(l'foo : 10, 'bar' : 12}) 
argl is: 2 

arg? is: 4 

additional non-keyword arg: 6 

additional non-keyword arg: 8 

additional keyword arg 'foo': 10 

additional keyword arg 'bar': 12 





最 终 ， 我 们 将 再 另外 进行 一 次 调用 ， 但 是 是 在 函数 调用 之 外 来 创建 我 们 的 元 组 和 字典 。 


2» afuple = (6, 7, 8) 

A» abict = Cz’: 9} 

22^ newfoo (l, 2, 3, x-4, y-5, *aTuple, **aDict) 
argi is: 1 





$— E 
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arg2 is: 2 





additional non-keyword arg: 3 
additional non-keyword arg: 6 
additional non-keyword arg: 
additional non-keyword arg: 
additional keyword arg 'z': 
additional keyword arg °x’: 


DKS DN 


additional keyword arg `y’: 





注意 我 们 的 元 组 和 字典 参数 仅仅 是 被 调 函数 中 最 终 接 收 的 元 组 和 字典 的 子 集 。 人 额外 的 非 关键 字 
f '3' DR x? Al y 关键 字 对 也 被 包含 在 最 终 的 参数 列表 中 ， 而 它们 不 是 ”* A s “的 可 变 
参数 中 的 元 素 。 

















之 前 的 1.6， 过 去 变 长 对 象 只 能 通过 apply O 函数 传递 给 被 调用 函数 。 现 在 的 调用 语法 已 经 可 
以 有 效 取代 apply O 的 使 用 。 下 面 演示 了 如 何 使 用 了 这 些 符 号 来 把 任意 类 型 任意 个 数 的 参数 传递 给 
任意 函数 对 象 。 








函数 式 编程 举例 





函数 式 编程 的 另外 一 个 有 用 的 应 用 出 现在 调试 和 性 能 测量 方面 上 。 你 正在 使 用 需要 每 夜 都 被 完 

全 测试 或 通过 衰退 ， 或 需要 给 对 潜在 改善 进行 多 次 迭代 计时 的 函数 来 工作 。 你 所 要 做 的 就 是 创建 一 

个 设置 测试 环境 的 诊断 函数 ， 然 后 对 有 疑问 的 地 方 ， 调 用 函数 。 因 为 系统 应 该 是 灵活 的 ， 所 以 想 

testee 函数 作为 参数 传 入 。 那 么 这 样 的 函数 对 ，timeit() 和 testit O, 可 能 会 对 如 今 的 软件 开发 者 
有 帮助 。 


























我 们 现在 将 展示 这 样 的 一 个 testit() 函 数 的 例子 的 源 代码 ( 见 例子 11. 5)。 我 们 将 留 下 timeitO 
函数 作为 读者 的 练习 《〈 见 习题 11. 12) 

该 模块 给 函数 提供 了 一 个 执行 测试 的 环境 。testit O 函数 使 用 了 一 个 函数 和 一 些 参数 ， 然 后 在 
en ME 用 给 定 的 参数 调用 了 那个 函数 。 如 果 函 数 成 功 的 完成 ， 会 返回 True 和 函数 的 

回 值 给 调用 者 。 任 何 的 失败 都 会 导致 False 和 异常 的 原因 一 同 被 返回 。 

(Exception 是 所 有 运行 时 刻 异 常 的 根 类 : 复习 第 10 章 以 获得 更 详细 的 资料 ) 

Example 11.5 Testing Functions (testit. py) 

testit 0) 用 其 参数 地 调用 了 一 个 给 定 的 函数 ， 成 功 的 话 ， 返 回 一 个 和 那 函 数 返回 值 打包 的 True 
的 返回 值 ， 或 者 False AURA. 



































1#!/usr/bin/env python 


2 

3def testit (func, *nkwargs, **kwargs): 
4 

Itry: 





$— 一 * 一 
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6retval = func (*nkwargs, **kwargs) 





7result = (True, retval) 

Sexcept Exception, diag: 

9result = (False, str(diag)) 

10 return result 

11 

12 def test: 

13 funcs = (int, long, float) 

14 vals = (1234, 12.34, '1234', ’ 12. 34’) 

15 

16 for eachFunc in funcs: 

17 print -— * 20 

18 for eachVal in vals: 

19 retval = testit(eachFunc, 

20 eachVal) 

21 if retvallQkh 

22 print 'fís(Ws) = % | 

23  (eachFunc. name ,  eachVal ), retval[1] 
24 else: 

25 print °%s(%s) = FAILED:' % | 

26 (eachFunc. name ,  eachVal ), retval[1] 





V/A 
28 if name  -- ' main 
29 test 











单元 测试 函数 test O 在 一 个 为 4 个 数字 的 输入 集合 运行 了 一 个 数字 转换 函数 的 集合 。 为 了 确定 
这 样 的 功能 性 ， 在 测试 中 有 两 个 失败 的 案例 。 这 里 是 运行 脚本 的 输出 : 





$ testit.py 





int (1234) = 1234 int (12. 34) 
= ]2 int C 1254') = 1234 
intl 12. 34’) = FAILED: invalid literal for int: 12.34 





long(1234) = 1234L 

long(12.34) = 12L 

longl 1234’) = 1234L 

long ( 12. 84’) = FAILED: invalid literal for long(): 12. 34 





float (1234) = 1234. 0 
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float (12. 34) = 12. 34 
float ( 1234’) = 1234. 0 
float (12. 84’) = 12. 34 


11. 7 函数 式 编程 








Python 不 是 也 不 大 可 能 会 成 为 一 种 函数 式 编程 语言 ， 但 是 它 支 持 许 多 有 价值 的 函数 式 编程 语言 
构建 。 也 有 些 表现 得 像 函 数 式 编程 机 制 但 是 从 传统 上 也 不 能 被 认为 是 函数 式 编程 语言 的 构建 。 Py thon 
提供 的 以 4 种 内 建 函 数 和 Lambda 表达 式 的 形式 出 现 


























11. 7. 1. 匿名 函数 与 lambda 











python 允许 用 lambda 关键 字 创 造 匿名 函数 。 匿 名 是 因为 不 需要 以 标准 的 方式 来 声明 ， 比 如 说 ， 
使 用 def 语句 。( 除 非 赋值 给 一 个 局 部 变量 , 这样 的 对 象 也 不 会 在 任何 的 名 字 空 间 内 创建 名 字 . ) 然而， 
作为 函数 ， 它 们 也 能 有 参数 。 一 个 完整 的 lambda“ 语 句 ” 代 表 了 一 个 表达 式 ， 这 个 表达 式 的 定义 体 
必须 和 声明 放 在 同一 行 。 我 们 现在 来 演示 下 匿名 函数 的 语法 : 

lambda [argl[, arg2, ... argN//]: expression 


参数 是 可 选 的 ， 如 果 使 用 的 参数 话 ， 参 数 通 常 也 是 表达 式 的 一 部 分 。 


























核心 笔记 : lambda 表达 式 返 回 可 调用 的 函数 对 象 。 

用 合适 的 表达 式 调用 一 个 lambda 生成 一 个 可 以 像 其 他 函数 一 样 使 用 的 函数 对 象 。 它 们 可 被 传 入 
给 其 他 函数 ， 用 额外 的 引用 别名 化 ， 作 为 容器 对 象 以 及 作为 可 调用 的 对 象 被 调用 〈 如 果 需 要 的 话 ， 
可 以 带 参 数 )。 当 被 调用 的 时 候 ， 如 过 给 定 相同 的 参数 的 话 ， 这 些 对 象 会 生成 一 个 和 相同 表达 式 等 价 
的 结果 。 它 们 和 那些 返回 等 价 表达 式 计 算 值 相同 的 函数 是 不 能 区 分 的 。 





在 我 们 看 任何 一 个 使 用 lambda 的 例子 之 前 ， 我 们 意欲 复习 下 单行 语句 ， 然 后 展示 下 lambda 表 
达 式 的 相似 之 处 。 


def true: 


return True 








上 面 的 函数 没有 带 任何 的 参数 并 且 总 是 返回 True. python 中 单行 函数 可 以 和 标题 写 在 同一 行 。 
如 果 那 样 的 话 ， 我 们 重 写 下 我 们 的 true O 函数 以 使 其 看 其 来 像 如 下 的 东西 : 


def true(): return True 














在 整 这 个 章节 ， 我 们 将 以 这 样 的 方式 呈现 命名 函数 ， 因 为 这 有 助 于 形象 化 与 它们 等 价 的 lamdba 
表达 式 。 至 于 我 们 的 true O 函数 ， 使 用 lambda 的 等 价 表 达 式 (没有 参数 ， 返 回 一 个 True) WH: 
lambda :True 








$ 
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命名 的 true O 函数 的 用 法 相当 的 明显 ， 但 lambda 就 不 是 这 样 。 我 们 仅仅 是 这 样 用 ， 或 者 我 们 
需要 在 某 些 地 方 用 它 进行 赋值 吗 ? 一 个 lambda 函数 自己 就 是 无 目地 服务 ， 正 如 在 这 里 看 到 的 : 














>>» lambda :True 
function <lambda> at f09ba0> 


在 上 面 的 例子 中 ， 我 们 简单 地 用 lambda 创建 了 一 个 函数 (对 象 ;， 但 是 既 没有 在 任何 地 方 保存 
它 , 也 没有 调用 它 。 这 个 函数 对 象 的 引用 计数 在 函数 创建 时 被 设置 为 True, 但 是 因为 没有 引用 保存 下 
来 ， 计 数 又 回 到 零 ， 然 后 被 垃圾 回收 掉 。 为 了 保留 住 这 个 对 象 ， 我 们 将 它 保 存 到 一 个 变量 中 ， 以 后 
可 以 随时 调用 。 现 在 可 能 就 是 一 个 好 机 会 。 

2225 true = lambda :True 

2» true( True 























这 里 用 它 赋 值 看 起 来 非常 有 用 。 相 似 地 ， 我 们 可 以 把 Lambda 表达 式 赋值 给 一 个 如 列表 和 元 组 的 
数据 结构 ， 其 中 ， 基 于 一 些 输入 标准 ， 我 们 可 以 选择 哪些 函数 可 以 执行 ， 以 及 参数 应 该 是 什么 。( 在 
下 个 部 分 中 ， 我 们 将 展示 如 何 去 使 用 带 函 数 式 编程 构建 的 lambda 表达 式 。 











我 们 现在 来 设计 一 个 带 2 个 数字 或 者 字符 串 参 数 ， 返 回 数 字 之 和 或 者 已 拼接 的 字符 串 的 函数 。 
我 们 先 将 展示 一 个 标准 的 函数 ， 然 后 再 是 其 末 命 名 的 等 价 物 。 





def add(x, y): return x + y ? lambda x, y: x ^ y 


默认 以 及 可 变 的 参数 也 是 允许 的 ， 如 下 例 所 示 : 
def usuallyAdd2(x, y=2): return xty ? lambda x, y-2: xty 
def showAllAsTuple(*z): return z ? lambda *z: z 








上 去 是 一 回 事 , 所 以 我 们 现在 将 通过 演示 如 何 能 在 解释 器 中 尝试 这 种 做 法 , 来 努力 着 让 你 相信 : 


>>>a = lambda x, y-2: x + y 
2M» a(3) 

a 

2» a(3 5) 

8 

2» a(0) 

2 

22^ a(0, 9) 

9 

p», 

225 b = lambda *z: z 














Edit By Vheavens 


Edit By Vheavens 


er 
* | * 


2» b(23, zyx’) 
(23, zyx’) 
2» b(42) 

(42, ) 





关于 lambda 最 后 补充 一 点 : 虽然 看 起 来 lambdda 是 一 个 函数 的 单行 版 本 ， 但 是 它 不 等 同 于 c++ 
的 内 联 语句 ， 这 种 语句 的 目的 是 由 于 性 能 的 原因 ， 在 调用 时 绕 过 函数 的 栈 分 配 。lambda 表达 式 运作 
起 来 就 像 一 个 函数 ， 当 被 调用 时 ， 创 建 一 个 框架 对 象 。 








11.7.2 Ate applyO . filter () mapO. reduce () 





在 这 个 部 分 中 ， 我 们 将 看 看 applyO ，filter()，map()， 以 及 reduce O 内 建 函数 并 给 出 一 些 如 
何 使 用 它们 的 例子 .这 些 函 数 提供 了 在 python 中 可 以 找到 的 函数 式 编 程 的 特征 。 正 如 你 想像 的 一 样 ， 
lambda 函数 可 以 很 好 的 和 使 用 了 这 些 函 数 的 应 用 程序 结合 起 来 ， 因 为 它们 都 带 了 一 个 可 执行 的 函数 
对 象 ，lambda 表达 式 提供 了 迅速 创造 这 些 函 数 的 机 制 。 


























d 11.2 函数 式 编程 的 内 建 函 数 


内 建 函 数 描述 
apply(func[, nkw][, kw])* 用 可 选 的 参数 来 调用 func, nkw 为 非 关 键 字 参 数 ，kw 关 
键 字 参数 ;返回 值 是 函数 调用 的 返回 值 。 


filter(func, seq)’ 调用 一 个 布尔 函数 func 来 迭代 遍历 每 个 seq 中 的 元 素 ; 返回 一 个 
使 func 返回 值 为 ture 的 元 素 的 序列 。 

map (func, seq1[, seq2. . . ])” 将 函数 func 作用 于 给 定 序列 (s) 的 每 个 元 素 ， 并 用 一 个 列表 来 提 
供 返回 值 ， 如 果 func 为 None， func 表现 为 一 个 身份 函数 ， 返 回 
一 个 含有 每 个 序列 中 元 素 集 合 的 n 个 元 组 的 列表 。 

reduce (func, seq[, init]) 将 二 元 函数 作用 于 seq 序列 的 元 素 ， 每 次 携带 一 对 (先前 的 结果 
以 及 下 一 个 序列 元 素 )， 连 续 的 将 现 有 的 结果 和 下 雨 给 值 作用 在 获 
得 的 随后 的 结果 上 ， 最 后 减少 我 们 的 序列 为 一 个 单一 的 返回 值 ， 如 
果 初 始 值 init 给 定 ， 第 一 个 比较 会 是 init 和 第 一 个 序列 元 素 而 不 
是 序列 的 头 两 个 元 素 。 

a. ”可 以 有 效 的 取代 1.6， 在 其 后 的 python 版 本 中 逐渐 淘汰 。 

b. 由 于 在 python2.0 中， 列表 的 综合 使 用 的 引入 ， 部 分 被 按 弃 。 



































*apply () 

正如 前 面 提 到 的 ， 函数 调用 的 语法 ， 现 在 允许 变量 参数 的 元 组 以 及 关键 字 可 变 参数 的 字典 ， 在 
pythonl.6 中 有 效 的 按 弃 了 applyO 。 这 个 函数 将 来 会 逐步 淘汰 ， 在 未 来 版 本 中 最 终 会 消失 。 我 们 
在 这 里 提 及 这 个 函数 既是 为 了 介绍 下 历史 ， 也 是 出 于 维护 具有 applay O 函数 的 代码 的 目的 。 
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filter() 

在 本 章 中 我 们 研究 的 第 二 个 内 建 函 数 是 filter () 。 想 像 下 ， 云 一 个 果园 ， 走 的 时 候 带 着 一 包 你 
从 树 上 采 下 的 苹果 。 如 果 你 能 通过 一 个 过 滤器 ， 将 包 训 中 好 的 苹果 留 下 ， 不 是 一 件 很 令 人 开心 的 事 
n3? 这 就 是 filter 0 函数 的 主要 前 提 。 给 定 一 个 对 象 的 序列 和 一 个 “过 滤 ” 函 数 ， 每 个 序列 元 素 都 
Whe Pate aS ET ime, | 保留 函数 返回 为 真 的 的 对 象 。 filter 函数 为 已 知 的 序列 的 每 个 元 素 调 用 
给 定 布尔 函数 。 每 个 filter 返回 的 非 零 〈true) 值 元 素 添加 到 一 个 列表 中 。 返 回 的 对 象 是 一 个 从 原 
台 队 列 中 “过 滤 后 ”的 队列 














如 果 我 们 想 要 用 纯 python 编写 filter () ， 它 或 许 就 像 这 样 : 


def filter(bool func, seq): 
filtered seq = [] 

for eachItem in seq: 

if bool func (eachItem) : 
filtered seq. append (eachItem) 
return filtered seq 


一 种 更 好 地 理解 filter O 的 方法 就 是 形象 化 其 行为 。 11-1 试 着 那样 做 。 


seq[0] seq[1] seq[2] seq[A-1] 


"filtered" 
filtered seq 


seq[1] seq[2] filter() 
(fillered seq[0]) (filtered seq[1]) 





Figure 11-1 How the filter() built-in function works 


在 图 11-1 中 ， 我 们 观察 到 我 们 原始 队列 在 顶端 ， 一 个 大 小 为 n 的 队列 ， 元 素 从 eql0], 
seq[1], . . . seq[lN-1j]。 每 一 次 对 bool func O 的 调用 , 举例 来 说 , bool func (seql1]), bool func 
(seq[0j]) 等 等 ， 每 个 为 True 或 False 的 的 返回 值 都 会 回 现 。( 因 为 Boolean 函数 的 每 个 定义 一 确保 
你 的 函数 确实 返回 一 个 真 或 假 )。 如 果 bool_func O 给 每 个 序列 的 元 返回 一 个 真 ， 那 个 元 素 将 会 被 插 
入 到 返回 的 序列 中 。 当 迭代 整个 序列 已 经 完成 ， filter 0 返回 一 个 新 创建 的 序列 。 我 们 下 面 展 示 在 
一 个 使 用 了 filer O 来 获得 任意 奇数 的 简短 列表 的 脚本 。 该 脚本 产生 一 个 较 大 的 随机 数 集 合 ， 然 后 
过 滤 出 所 有 的 的 偶数 ， 留 给 我 们 一 个 需要 的 数据 集 。 当 一 开始 编写 这 个 例子 的 时 候 ，oddnogen. py 如 
下 所 示 : 
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from random import randint 





def odd (n): 
return n % 2 


allNums = [] 

for eachNum in range(9): 
allNums. append (randint (1, 99)) 
print filter(odd, allNums) 











代码 包括 两 个 函数 : odd() ， 确定 一 个 整数 是 奇数 〈 真 ) 或 者 偶数 〈 假 ) Boolean 函数 ， 以 及 
main()， 主 要 的 驱动 部 件 ,main O 的 目的 是 来 产生 10 个 在 1 到 100 之 间 的 随机 数 :然后 调用 filter O 
来 移 除 掉 所 有 的 偶数 。 最 后 ， 先 显示 出 我 们 过 滤 列 表 的 大 小 ， 然 后 是 奇数 的 集合 











导入 和 运行 这 个 模块 几 次 后 ， 我 们 能 得 到 如 下 输出 : 


$ python oddnogen. py 
/9 83, 55, 65J 


$ python oddnogen. py 
[39, 77, 39, 7L 1] 


$ python oddnogen. py 
[23, 39, 9, 1, 63, 91] 


$ python oddnogen. py 
/41, 85, 93, 53, 3J 


第 一 次 重 构 


在 第 二 次 浏览 时 ， 我 们 注意 到 odd O 是 非常 的 简单 的 以 致 能 用 一 个 lambda KERB M 
from random import randint allNums = [] 

for eachNum in range(9): 

allNums. append (randint(1, 99)) 

print filter(lambda n: n%2, allNums) 


Refactoring Pass 2 


我 们 已 经 提 到 list 综合 使 用 如 何 能 成 为 filter 0 合适 的 蔡 代 者 ， 如 下 便 是 : 





from random import randint 





$— 一 * 一 
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allNums = /J 
for eachNum in range(9): 


allNums. append (randint(1, 99)) 
print [n for n in allNums if n%2/ 





Refactoring Pass 3 


我 们 通过 整合 另外 的 列表 解析 将 我 们 最 后 的 列表 放 在 一 起 ， 来 进一步 简化 我 们 的 代码 。 正 如 你 
如 下 看 到 的 一 样 ， 由 于 列表 解析 灵活 的 语法 ， 就 不 再 需要 一 个 暂时 的 变量 了 。( 为 了 简单 ， 我 们 用 
一 个 较 短 的 名 字 将 randint 0 倒 入 到 我 们 的 代码 中 ) 














from random import randint as ri 
print [n for n in [ri(1,99) for i in range (9) ] if n%2] 








虽然 比 原来 的 长 些 ， 但 是 这 行 扮演 了 该 例子 中 核心 部 分 的 代码 不 再 如 其 他 人 想 的 那么 模糊 不 清 。 


map () 
map O A ÆRA- ee 序列 .然而 ,不 像 filter() mapO 


将 函数 调用 “映射 ”到 每 个 序列 的 元 素 上 ， 并 返回 一 个 含有 所 有 返回 值 的 列表 。 E 
在 最 简单 的 形式 中 ，map 0 带 一 个 函数 和 队列 ， 将 函数 作用 在 序列 的 每 个 元 素 上 ， 然后 创建 


由 每 次 函数 应 用 组 成 的 返回 值 列 表 。 所 以 如 果 你 的 映射 函数 是 给 每 个 进入 的 数字 加 2， 并 且 你 将 这 个 
函数 和 一 个 数字 的 列表 传 给 map 〈)， 返 回 的 结果 列表 是 和 原始 集合 相同 的 数字 集合 ， 但 是 每 个 数字 
都 加 了 2. 






































如 果 我 们 要 用 python 编写 这 个 简单 形式 的 map O 如 何 运 作 的 ， 它 可 能 像 在 图 11-2 HRY 
如 下 代码 : 


def map (func, seq): 

mapped seq = [] 

for eachItem in seq: 

mapped seq. append (func (eachItem)) 
return mapped seq 
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seq[0] seq[1] seq[2] seq(N-1] 


mapped seq 


func(seq[O]) func(seq[2]) func(seq[N—-1]) 
func(seq[1]) map () 





Figure 11-2 How the map() built-in function works 





我 们 可 以 列举 一 些 简 短 的 Lambda. 函数 来 展示 如 何 用 map O 处 理 实 际 数据 : 


> map((lambda x: xt2), [0, L 2.3, 4, 5p) 
/2 3% 4 8 6 7 

225 

22» map (lambda x: x**2, range (6)) 

[0, 1, 4 9, 16, 25] 

205 [x12 for x in range(6) ] 

/2 $ 4 5, 6 7 

225 

D»»>[x##2 for x in range(6) ] 

[0 1, 4 9, 16, 25] 


我 们 已 经 讨论 了 有 时 map O 如 何 被 列表 解析 取代 ， 所 以 这 里 我 们 再 分 析 下 上 面 的 两 个 例子 。 形 
式 更 一 般 的 map O 能 以 多 个 序列 作为 其 输入 。 如 果 是 这 种 情况 ， 那么 map 0 〇 会 并 行 地 迭代 每 个 序 
列 。 在 第 一 次 调用 时 ， map O 会 将 每 个 序列 的 第 一 个 元 素 捆 绑 到 一 个 元 组 中 ， 将 func 函数 作用 到 
map O E, map O 已 经 完成 执行 的 时 候 ， 并 将 元 组 的 结果 返回 到 mapped_seq 映射 的 ， 最 终 以 
整体 返回 的 序列 上 。 图 11-2 阐释 了 一 个 map O 如 何 和 单一 的 序列 一 起 运行 。 如 果 我 们 用 带 有 每 个 
序列 有 N 个 对 象 的 MX 个 序列 来 的 map 〈)， 我 们 前 面 的 图 表 会 转变 成 如 图 11-3 中 展示 的 图 表 那 样 。 
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func(seq1[0], seq2[0], ... seqM[0]) func(seq1[N—1], ... seqM[A-1]) 


func(seq1[1], seq2[1], ... seqM[1]) - 
map 








11-3 内 建 函 数 map ©) 如 何 和 >1 的 序列 一 起 运作 。 
这 里 有 些 使 用 带 多 个 序列 的 map O 的 例子 


>>> map(lambda x, y: x ^ y, [35 [2,4 6) 

EL ZA dl] 

225 
>>> map (lambda x, ye (x+y, x-y), LL, 3,5], [2,4 8] 
LOL =. q4 =; (i, “27 
225 
>> map (None, [1, 3,5], [2,4,6]) 

PU 2, (3 V, © cu 


上 面 最 后 的 例子 使 用 了 map (和 一 个 为 None 的 函数 对 象 来 将 不 相关 的 序列 归并 在 一 起 。 这 种 思 
想 在 一 个 新 的 内 建 函 数 ，zip， 被 加 进来 之 前 的 python2. 0 是 很 普遍 的 。 而 zip 是 这 样 做 的 : 

2» zip(ÍL3,5], [2,4 6) 

[A 2, (3 V, mU 





reduce () 








函数 式 编程 的 最 后 的 一 部 分 是 reduce O, reduce 使 用 了 一 个 二 元 函数 一 个 接收 带 带 两 个 值 
作为 输入 ， 进 行 了 一 些 计算 然后 返回 一 个 值 作为 输出 )， 一 个 序列 ， 和 一 个 可 选 的 初始 化 器 ， 晶 有 成 
效 地 将 那个 列表 的 内 容 “ 减 少 ”为 一 个 单一 的 值 ， 如 同 它 的 名 字 一 样 。 在 其 他 的 语言 中 ， 这 种 概念 
PRENIE- 

它 通 过 取出 序列 的 头 两 个 元 素 ， 将 他 们 传 入 二 元 函数 来 获得 一 个 单一 的 值 来 实现 。 然 后 又 用 这 
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个 值 和 序列 的 下 一 个 元 素来 获得 又 一 个 值 ， 然 后 继续 直到 整个 序列 的 内 容 都 遍历 完毕 以 及 最 后 的 值 
会 被 计算 出 来 为 止 。 
你 可 以 尝试 去 形象 化 reduce 如 下 面 的 等 同 的 例子 : 








reduce(func, [l, 2, 3]) =  func(func(1, 2), 3) 

















有 些 人 认为 reduce O 合适 的 函数 式 使 用 每 次 只 需要 仪 需 要 一 个 元 素 。 (E ET FP aR EX V 
我 们 拿 了 两 个 元 素 因为 我 们 没有 从 先前 的 值 〈 因 为 我 们 没有 任何 先前 的 值 ) 中 获得 的 一 个 “结果 ”。 
这 就 是 可 选 初始 化 器 出 现 的 地 方 〈 参 见 下 面 的 init 变量 )。 如 果 给 定 初始 化 器 ， 那么 一 开始 的 迭代 
会 用 初始 化 器 和 一 个 序列 的 元 素来 进行 ， 接 着 和 正 第 的 一 样 进行 。 

















如 果 我 们 想 要 试 着 用 纯 python 实现 reduce), 它 可 能 会 是 这 样 : 





If init is None: # initializer? 

res = lseq.pop(0) # no 

else: 

res - init # yes 

for item in lseq: # reduce sequence 

res = bin func(res, item) # apply function 





return res # return result 

从 概念 上 说 这 可 能 4 个 中 最 难 的 一 个 ， 所 以 我 们 应 该 再 次 向 你 演示 一 个 例子 以 及 一 个 函数 式 
图 表 〈 见 图 11-4). reduce OHJ “hello world” 是 其 一 个 简单 加 法 函数 的 应 用 或 在 这 章 前 面 看 到 的 
与 之 等 价 的 Lamda 

€ def mySum(x,y): return xty 





€ lambda x,y: xty 





给 定 一 个 列表 ， 我 们 可 以 简单 地 创建 一 个 循环 ， 迭代 地 遍历 这 个 列表 ， 再 将 现在 元 素 加 到 前 
面 元 素 的 累加 和 上 ， 骤 后 当 循 环 结束 就 能 获得 所 有 值 的 总 和 。 








225 def mySum(x, y): return x+y 
2» allNums = range(5) # [0, 1, 2, 3, 4] 
22^ total = 0 
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reduce() 
[Č ms 
(a) The value ofthis result is bin_func(seq[0], segI11) 
(b) The value of this result is bin. £unc(bin, func(seq[01, seq[1]), seq[2]), etc. 





图 11-4 reduce O 内 建 函 数 是 如 何 工 作 的 。 


222 for eachNum in allNums: 
total = mySum(total, eachNum) 
2» print 'the total is:', total the total is: 10 


dE 


使 用 lambda 和 reduce ©) ,我 们 可 以 以 一 行 代码 做 出 相同 的 事情 。 





2» print 'the total is:', reduce((lambda x, y: x+y), range(5)) 


the total is: I0 





给 出 了 上 面 的 输入 ，reduce O 函数 运行 了 如 下 的 算术 操作 。 


(CO 4) 423 443) 94)» 10 





用 list 的 头 两 个 元 素 〈0，1)， 调 用 mySum 0 来 得 到 1， 然 后 用 现在 的 结果 和 下 一 个 元 素 2 来 再 





次 调用 mySum() ， 再 从 这 次 调用 中 获得 结果 ， 与 下 面 的 元 素 3 配对 然后 调用 mySumO ， 
面 的 求 和 和 4 来 调用 mySum O 得 到 10, 10 即 为 最 终 的 返回 值 。 


11. 7. 3 偏 函数 应 用 
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最 终 拿 整个 前 
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currying 的 概念 将 函数 式 编程 的 概念 和 默认 参数 以 及 可 变 参 数 结合 在 一 起 。 一 个 带 n 个 参数 ， 
curried 的 函数 固化 第 一 个 参数 为 固定 参数 , 并 返回 男 一 个 带 n-1 个 参数 函数 对 象 , 分 别 类 似 于 LISP 
的 原始 函数 car 和 cdr 的 行为 。Currying 能 泛 化 成 为 偏 函 数 应 用 (PFA)， 这 种 函数 将 任意 数量 ( 顺 
序 ) 的 参数 的 函数 转化 成 男 一 个 带 剩余 参数 的 函数 对 象 。 




















在 某 种 程度 上 ， 这 似乎 和 不 提供 参数 ， 就 会 使 用 默认 参数 情形 相似 。 在 PFA 的 例子 中 ， 参数 
不 需要 调用 函数 的 默认 值 ， 只 需 明 确 的 调用 集合 。 你 可 以 有 很 多 的 偏 函 数 调 用 ， 每 个 都 能 用 不 同 的 
参数 传 给 函数 ， 这 便 是 不 能 使 用 默认 参数 的 原因 。 

这 个 特征 是 在 python2. 5 的 时 候 被 引入 的 ， 通 过 functools 模块 能 很 好 的 给 用 户 调用 。 












































简单 的 函数 式 例子 








如 何 创建 一 个 简单 小 巧 的 例子 呢 ?” 我 们 来 使 用 下 两 个 简单 的 函数 add OI mulO, 两 者 都 来 自 
operator 模块 。 这 两 个 函数 仅仅 是 我 们 熟悉 的 + 和 # 操 作 符 的 函数 式 接 口 ， 举 例 来 说 ，add (x, y) x+y 
一 样 。 在 我 们 的 程序 中 ， 我 们 经 常 想 要 给 和 数字 加 一 或 者 乘 以 100 





除了 大 量 的 ， 如 add (1, foo), add (1, bar), ，mul (100，foo)，mul(100，bar) 般 的 调用 ， 拥 
有 已 存在 的 并 使 函数 调用 简化 的 函数 不 是 一 件 很 美妙 的 事 吗 ? 举例 来 说 ，addl (foo) ，addl (bar), 
mul100， 但 是 却 不 用 去 实现 函数 add] O 和 mul1000 ? 哦 ， 现 在 用 PFAs 你 就 可 以 这 样 做 。 你 可 以 通 
过 使 用 functional 模块 中 的 partial © 函数 来 创建 PFA: 














2225 from operator import add, mul 

>>> from functools import partial 

22» addi = partial (add, 1) # addl(x) == add(1, x) 
22» mull00 = partial (mul, 100) # mull00(x) == mul (100, x) 
p» 

>>> add! (10) 

11 

>> add! (1) 

2 

>>> mull00 (10) 

1000 

>>> mull00 (500) 

50000 


这 个 例子 或 许 不 能 让 你 看 到 PFAs 的 威力 ， 但 是 我 们 不 得 不 从 从 某 个 地 方 开始 。 当 调用 带 许 多 参 
数 的 函数 的 时 候 ，PFAs 是 最 好 的 方法 。 使 用 带 关键 字 参 数 的 PFAs 也 是 较 简 单 的 ， 因为 能 显示 给 出 
特定 的 参数 ， 要 么 作为 curried 参数 ， 要 么 作为 那些 更 多 在 运行 时 刻 传 入 的 变量 ， 并 且 我 们 不 需 担 
心 顺序 。 下 面 的 一 个 例子 来 自 python 文档 中 关于 在 应 用 程序 中 使 用 ， 在 这 些 程 序 中 需要 经 常 将 二 进 
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制 〈 作 为 字符 串 ) 转换 成 为 整数 。 
22» basefwo = partial(int, base=2) 


2^» basefwo. doc = 'Convert base 2 string to an int.’ 
25» baseTwo ( 10010’) 
18 

















这 个 例子 使 用 了 int O 内 建 函 数 并 将 base 固定 为 2 来 指定 二 进 制 字 符 串 转化 。 现 在 我 们 没有 多 
次 用 相同 的 第 二 参数 (2) 来 调用 int O, 比如 ( 10010" , 2), FAR, 可 以 只 用 带 一 个 参数 的 新 baseTwo 
O 函数 。 接 着 给 新 的 (部 分 ) 函数 加 入 了 新 的 文档 并 又 一 次 很 好 地 使 用 了 “函数 属性 ”( 见 上 面 的 
11. 3.4 部 分 )， 这 是 很 好 的 风格 。 要 注意 的 是 这 里 需要 关键 字 参 数 base 


























警惕 关键 字 








如 果 你 创建 了 不 带 base 关键 字 的 偏 函数 ， 比 如 ， baseTwo- BAD = partial(int，2) ， 这 可 能 
会 让 参数 以 错误 的 顺序 传 入 int 〈)， 因 为 固定 参数 的 总 是 放 在 运行 时 刻 参数 的 左边 ， 比如 
baseTwoBAD(x) == int(2, 3). 。 如 果 你 调用 它 ， 它 会 将 2 作为 需要 转化 的 数字 ，base 作为 10010 
来 传 入 ， 接 着 产生 一 个 异常 : 














>> baseTwoBAD = partial (int, 2) 

>> baseTwoBAD ( 10010’) 

Traceback (most recent call last): File “<stdin>”, line 1, in <module> 
TypeError: an integer is required 














由 于 关键 字 放 置 在 恰当 的 位 置 ， 顺序 就 得 固定 下 来 ， 因 为 ， 如 你 所 知 ， 关 键 字 参数 总 是 出 现 
形 参 之 后 ， 所 以 baseTwo(x) == int(x, base-2). 














简单 GUI 类 的 例子 。 








PFAs 也 扩展 到 所 有 可 调用 的 东西 ， 如 类 和 方法 。 一 个 使 用 PFAs 的 优秀 的 例子 是 提供 了 “部 分 
gui 模范 化 ”。GUI 小 部 件 通常 有 很 多 的 参数 ， 如 文本 ， 长 度 ， 最 大 尺寸 ， 背景 和 前 景色 ， 活 动 或 者 
非 活 动 ， 等 等 。 如 果 想 要 固定 其 中 的 一 些 参 数 ， 如 让 所 有 的 文本 标签 为 蓝 底 白 字 ， 你 可 以 准确 地 
以 PFAs 的 方式 ， 自 定义 为 相似 对 象 的 伪 模 板 。 























例 11.6 偏 函 数 应 用 GUI (ppfaGUI. py) 














这 古 较 有 用 的 侦 函 数 应 用 的 例子 ， 或 者 更 准 胡 


cw 
ot 


和 说 ,“ 部 分 类 实例 化 ” 。。。 为 什么 呢 ? 








7 #!/usr/bin/env python 
2 
3 from functools import partial 





$— 一 * 一 
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4 import Tkinter 

9 

6 root = Tkinter. Tk Q 

7 MyButton = partial (Tkinter. Button, root, 
8 fg= white’, bg= blue’) 

9 bl = MyButton(text- Button 1’) 

10 b2 = MyButton(text=’ Button 2’) 

11 qb = MyButton (text= QUIT’, bg-'red', 
12 command=root. qui t) 

13 bl. pack 0 

14 b2. pack 0 

15 qb. pack(fill-Tkinter. X, expand-True) 
16 root. title ( PFAs!’) 

17 root. mainloop () 











(E 7-8 行 ， 我 们 给 Tkinter. Button 创建 了 “部 分 类 实例 化 器 ”( 因 为 那 便 是 它 的 名 字 ， 而 不 是 偏 
KZO, 固定 好 父 类 的 窗口 参数 然后 是 前 景色 和 背景 色 。 我 们 创建 了 两 个 按钮 bl 和 b2 来 与 模板 匹配 ， 
只 让 文本 标签 唯一 。quit 按钮 (11-12 行 ) 是 稍微 自 定义 过 的 ， 带 有 不 同 的 背景 色 〈 红 色 ， RET 

默认 的 蓝 色 ) 并 配置 了 一 个 回调 的 函数 ， 当 按钮 被 按 下 的 时 候 ， 关 闭 窗口 。( 另 外 的 的 两 个 按钮 没 
有 函数 ， 当 他 们 被 按 下 的 的 时 候 ) 




















没有 MyButton“ 模 板 ” 的 话 , 你 每 次 会 不 得 不 使 用 “完全 ”的 语法 (因为 你 仍然 没有 给 全 参数 ， 
由 于 有 大 量 你 不 传 入 的 ， 含 有 默认 ] 值 的 参数 ) 
bl = Tkinter.Button(root,  fg-'white',  bg= blue,  text- Button 1') b2 = 
Tkinter.Button(root, fg-'white', bg-'blue', text-'Button 2') qb = Tkinter. Button (root, 
fg- white’, text-' QUIT’, bg-'red', 
command=root. quit) 








这 就 一 个 简单 的 GUI 的 截图 : 








当 你 的 代码 可 以 变 得 更 紧凑 和 易 读 的 时 候 ， 为 什么 要 还 有 重复 的 做 令 人 心烦 的 事 ? 你 能 在 18 GK 
章 找 到 更 多 关于 GUI 编程 的 资料 ， 在 那 我 们 着 重 描写 了 一 个 使 用 PFAs 的 例子 。 从 你 迄今 为 止 看 到 
的 内 容 中 , 可 以 发 现 , 在 以 更 函数 化 编程 环境 提供 默认 值 方面 , PFA 带 有 模板 以 及 “style-sheeting” 
的 感觉 。 你 可 以 在 Python Library Reference, “What’ s New in Python 2.5” 文 要 和 指定 的 PEP309 


E 
| 
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Æ, XT functools 模块 的 文档 中 阅读 到 更 多 关于 pfa 的 资料 。 





11.8 变量 作用 域 








标识 符 的 作用 域 是 定义 为 其 声明 在 程序 里 的 可 应 用 范围 ， 或 者 即 是 我 们 所 说 的 变量 可 见 性 。 换 
名 话说， 就 好 像 在 问 你 自己 ， 你 可 以 在 程序 里 的 哪些 部 分 去 访问 一 个 制定 的 标识 符 。 变 量 可 以 是 局 
部 域 或 者 全 局 域 。 

















11.8.1 全 局 变量 与 局 部 变量 


定义 在 函数 内 的 变量 有 局 部 作用 域 ， 在 一 个 模块 中 最 高 级 别 的 变量 有 全 局 作用 域 。 在 编译 器 理 
论 里 有 名 的 “ 龙 “ 书 中 ，Aho，Sethi， 和 ULLman 以 这 种 方法 进行 了 总 结 。 












































“声明 适用 的 程序 的 范围 被 称 为 了 声明 的 作用 域 。 在 一 个 过 程 中 , 如 果 名 字 在 过 程 的 声明 之 内 ， 
它 的 出 现 即 为 过 程 的 局 部 变量 ， 否 则 的 话 ， 出 现 即 为 非 局 部 的 “ 




















全 局 变量 的 一 个 特征 是 除非 被 删除 掉 ， 否 则 它们 的 存活 到 脚本 运行 结束 ， 且 对 于 所 有 的 函数 ， 
他 们 的 值 都 是 可 以 被 访问 的 ， 然 而 局 部 变量 ， 就 像 它 们 存放 的 栈 ， 和 暂时 地 存在 ， 仅 仅 只 依赖 于 定义 
它们 的 函数 现 阶段 是 否 处 于 活动 。 当 一 个 函数 调用 出 现时 ， 其 局 部 变量 就 进入 声明 它们 的 作用 域 。 
在 那 一 刻 ， 一 个 新 的 局 部 变量 名 为 那个 对 象 创建 了 ,一旦 函数 完成 ， 框 架 被 释放 ， 变 量 将 会 离开 作 
用 域 。 


















































global str = 'foo' 

def foo(): 

local str = har 

return global str + local str 








上 面 的 例子 中 ，global_str 是 全 局 变量 ， 而 local str 是 局 部 变量 。foo O 函数 可 以 对 全 局 和 局 
变量 进行 访问 ， 而 代码 的 主体 部 分 只 能 访问 全 局 变量 。 





um 





nk 








核心 笔记 : 搜索 标识 符 〈aka 变量 ， 名 字 ， 等 等 ) 

当 搜 索 一 个 标识 符 的 时 候 ，python 先 从 局 部 作用 域 开始 搜索 。 如 果 在 局 部 作用 域内 没有 找到 那 
个 名 字 ， 那 么 就 一 定 会 在 全 局 域 找 到 这 个 变量 否则 就 会 被 抛 出 NameError 异常 。 

一 个 变量 的 作用 域 和 它 寄 住 的 名 字 空 间 相 关 。 我 们 会 在 12 章 正 式 介绍 名 字 空 间 ; 对 于 现在 只 能 
说 子 空 间 仅仅 是 将 名 字 映 射 到 对 象 的 命名 领域 ， 现 在 使 用 的 变量 名 字 虚 拟 集合 。 作 用 域 的 概念 和 用 
于 找到 变量 的 名 字 空 间 搜索 顺序 相关 。 当 一 个 函数 执行 的 时 候 ， 所 有 在 局 部 命名 空间 的 名 字 都 在 局 
部 作用 域内 。 那 就 是 当 查 找 一 个 变量 的 时 候 ， 第 一 个 被 搜索 的 名 字 空 间 。 如 果 没 有 在 那 找到 变量 的 
话 ， 那 么 就 可 能 找到 同名 的 全 局 变量 。 这 些 变量 存储 〈 搜 索 ) 在 一 个 全 局 以 及 内 建 的 名 字 空 间 ,。 

仅仅 通过 创建 一 个 局 部 变量 来 “隐藏 “或 者 覆盖 一 个 全 局 变量 是 有 可 能 的 。 回 想 一 下 ， 局 部 名 
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字 空间 是 首先 被 搜索 的 ， 存 在 于 其 局 部 作用 域 。 如 果 找 到 一 个 名 字 ， 搜 索 就 不 会 继续 去 寻找 一 个 全 
局 域 的 变量 ， 所 以 在 全 局 或 者 内 建 的 名 字 空 间 内 ， 可 以 覆盖 任何 匹配 的 名 字 。 


























同样 ， 当 使 用 全 局 变量 同名 的 局 部 变量 的 时 候 要 小 心 。 如 果 在 赋予 局 部 变量 值 之 前 ， 你 在 函数 
中 (为 了 访问 这 个 全 局 变量 ) 使 用 了 这 样 的 名 字 ， 你 将 会 得 到 一 个 异常 NAMEERROR 或 者 Unbound- 
LocalError)， 而 这 取决 于 你 使 用 的 python 版 本 。 











11.8.2. globa 语句 


如 果 将 全 局 变量 的 名 字 声 明 在 一 个 函数 体内 的 时 候 ， 全 局 变量 的 名 字 能 被 局 部 变量 给 履 盖 掉 。 
这 里 有 另外 的 例子 ， 与 第 一 个 相似 ， 但 是 该 变量 的 全 局 和 局 部 的 特性 就 不 是 那么 清晰 了 。 












































def foo(): 

print ^|ncalling Zoo0 ^ 
bar = 200 

print “in fooQ, bar is’, bar 
bar = 100 


print “in main , bar is^, bar foo() 


print “\nin main , bar is (still), bar 


$ 得 到 如 下 输出 : * 


in main, bar is 100 
calling foo()... 

in foo(), bar is 200 

in main , bar is (still) 100 











我 们 局 部 的 bar 将 全 局 的 bar 推出 了 局 部 作用 域 。 为 了 明确 地 引用 一 个 已 命名 的 全 局 变量 ， 必 
须 使 用 global 语句 。global 的 语法 如 下 : 

















global varil, var2[, ... varN//] 








修改 上 面 的 例子 ， 可 以 更 新 我 们 代码 ， 这 样 我 们 便 可 以 用 全 局 版 本 的 is this global 而 无 须 创 
建 一 个 新 的 局 部 变量 。 





2» is this global = 'xyz' 
2» def foo: 
global is this global 
this is local = 'abc' 
is this global = "def" 
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2> fool 

abcdef 

22» print is this global 
def 





print this is local * is this global 


11. 8. 3. 作用 域 的 数字 





python MAE EHS SHAKER, UIE python2. 1 中 的 ， 匹 配 静态 拒 套 的 作用 域 。 然 
而 ,在 2.1 至 前 的 版 本 中 ， 最 多 为 两 个 作用 域 : 一 个 函数 的 局 部 作用 域 和 全 局 作用 域 。 虽 然 存 在 多 
个 函数 的 嵌 涛 ， 但 你 不 能 访问 超过 两 个 作用 域 。 


def foo(): 
m-3 

def bar: 
n=4 

print m+n 


print m bar 0 
虽然 这 代码 在 今天 能 完美 的 运行 .... 


2> fool) 

3 

7 

. . . Æ python2. 1 之 前 执行 它 将 会 产生 错误 。 





2» fool) 

Traceback (innermost last): 
File “stdin, line d, im ? 
File “<stdin>”, line 7, in foo 
File “<stdim”, line 5, in bar 


NameError: m 








在 函数 bar O 内 访问 foo O 的 局 部 变量 m 是 非法 的 , 因为 m 是 声明 为 foo O 的 局 部 变量 。 从 bar () 
中 可 访问 唯一 的 作用 域 为 局 部 作用 域 和 全 局 作用 域 。foo O 的 局 部 作用 域 没 有 包含 在 上 面 两 个 作用 域 
的 列表 中 。 注 意 ' print m 语句 的 输出 成 功 了 ， 而 而 对 bar 0 的 函数 调用 却 失 败 了 。 幸 运 的 是 ， 由 于 
python 的 现 有 嵌 套 作用 语 规则 ， 今 天 就 不 存在 这 个 问题 了 。 
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11.8.4 Aa 








由 于 python [JE S CEST, 如 我 们 早先 看 到 的 , 定义 内 部 函数 变 得 很 有 用 处 。 在 下 面 的 部 分 中 ， 
我 们 将 着 重 讨论 作用 域 和 lambda， 但 是 在 python2.1 之 前 ， 当 作用 域 规 改 则 变 为 今天 这 样 之 前 ， 内 
部 函数 也 会 遭受 到 相同 的 问题 。 如 果 在 一 个 内 部 函数 里 ， 对 在 外 部 作用 域 (但 不 是 在 全 局 作用 域 ) 的 
变量 进行 引用 ,那么 内 部 函数 就 被 认为 是 closure。 定 义 在 外 部 函数 内 的 但 由 内 部 函数 引用 或 者 使 用 
的 变量 被 称 为 自由 变量 。closures 在 函数 式 编程 中 是 一 个 重要 的 概念 ，Scheme 和 Haskell 便 是 函数 
式 编 程 中 两 种 。Closures 从 句法 上 看 很 简单 (和 内 部 函数 一 样 简 单 ) 但 是 仍然 很 有 威力 。 
























































闭 包 将 内 部 函数 自己 的 代码 和 作用 域 以 及 外 部 函数 的 作用 结合 起 来 。 闭 包 的 词法 变量 不 属于 全 
局 名 字 空 间 域 或 者 局 部 的 一 而 属于 其 他 的 名 字 空 间 ， 带 着 “流浪 “的 作用 域 。( 注 意 这 不 同 于 对 象 因 
为 那些 变量 是 存活 在 一 个 对 象 的 名 字 空 间 但 是 闭 包 变量 存活 在 一 个 函数 的 名 字 空 间 和 作用 域 ) 那么 
为 什么 你 会 想 要 用 closues? 

















Closurs 对 于 安装 计算 , 隐藏 状态 , 以 及 在 函数 对 象 和 作用 域 中 随意 地 切换 是 很 有 用 的 。 closurs 
在 GUI 或 者 在 很 多 API 支持 回调 函数 的 事件 驱动 编程 中 是 很 有 些 用 处 的 。 以 绝对 相同 的 方式 ， 应 用 
于 获取 数据 库 行 和 处 理 数据 。 回 调 就 是 函数 。 闭 包 也 是 函数 ， 但 是 他 们 能 携带 一 些 额 外 的 作用 域 。 
它们 仅仅 是 带 了 额外 特征 的 函数 ……… 另外 的 作用 域 。 






































你 可 能 会 觉得 财 包 的 使 用 和 这 章 先前 介绍 的 信函 数 应 用 非常 的 相似 ， 但 是 与 朵 包 的 使 用 相 比 ， E 
PFA 更 像 是 currying， 因 为 财 包 和 函数 调用 没 多 少 相 关 ， 而 是 关于 使 用 定义 在 其 他 作用 域 的 变量 。 








简单 的 闭 包 的 例子 


下 面 是 使 用 闭 包 简单 的 例子 。 我 们 会 模拟 一 个 计数 器 ， 同 样 也 通过 将 整数 包 右 为 一 个 列表 的 单 
一 元 素来 模拟 使 整数 易 变 。 


def counter(start at-0): count = [start at] def incr(): 
count[0/ += 1 
return count[0/ 


return incr 


counter () 做 的 唯一 一 件 事 就 是 接受 一 个 初始 化 的 的 值 来 开始 计数 ， 并 将 该 值 赋 给 列表 count ME 
个 成 员 。 然 后 定义 一 个 incr (0) 的 内 部 函数 。 通 过 在 内 部 使 用 变量 count， 我 们 创建 了 一 个 闭 包 
因为 它 现在 携带 了 整个 counter O 作用 域 。incr 0 增加 了 正在 运行 的 count 然后 返回 它 。 然 后 最 后 的 
魔法 就 是 counter (返回 一 个 incr， 一 个 (可 调用 的 ) 函数 对 象 。 如 我 们 交互 地 运行 这 个 函数 ， 我 
们 将 得 到 如 下 的 输出 注意 这 看 起 来 和 实例 化 一 个 counter 对 象 并 执行 这 个 实例 有 多 么 相似 : 























22» count = counter (5) 














Edit By Vheavens 


Edit By Vheavens 


ee 
T | 


2» print count () 

6 

2» print count () 

7 

22» count2 = counter (100) 
2» print count2 0) 

101 

2 print count () 

8 
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掉 这 个 类 的 _call 0 特别 方法 来 使 他 的 实例 可 调用 。 这 里 我 们 能 够 使 用 一 对 函数 来 做 这 事 。 























现在 ， 在 很 多 情况 下 ， 类 是 最 适合 使 用 的 。 闭 包 更 适合 需要 一 个 必需 有 自己 的 作用 域 的 回调 函 
数 情况 ， 尤 其 是 回调 函数 是 很 小 巧 而 且 简 单 的 ， 通 常 也 很 聪明 。 跟 平常 一 样 ， 如 果 你 使 用 了 闭 包 ， 
对 你 的 代码 进行 注释 或 者 用 文档 字符 串 来 解释 你 正 做 的 事 是 很 不 错 的 主意 

















追踪 闭 包 词法 的 变量 





下 面 两 个 部 分 包含 了 给 高 级 读者 的 材料 …… 如 果 你 愿意 的 话 ， 你 可 以 跳 过 去 。 我 们 将 讨论 如 何 
能 使 用 函数 的 func_closure 属性 来 追踪 自由 变量 。 这 里 有 个 显示 追踪 的 代码 片断 。 如 果 我 们 运行 
这 段 代 码 ， 将 得 到 如 下 输入 : 

f2 closure vars: [' «cell at 0x5ee30: int object at 

0x200377c^' J 

f3 closure vars: [' «cell at 0x5ee90: int object at 

0x2003770»', '«cell at 0x5ee30: int object at 

0x200377c^' ] 

nt °w id-0x2003788 val=L 

nt 'x' id-0x200377c val=2> 

<int `y? id-0x2003770 val-3» 

<int `z? id-0x2003764 val-4» 




















例子 11. 7 追踪 闭 包 变量 (closureVars. py) 





这 个 例子 说 明了 如 何 能 通过 使 用 函数 的 fune. closure 属性 来 追踪 闭 包 变 量 


7 #!/usr/bin/env python 
2 
3 output = 'Xint Yr id=%#0x val=%d>’ 





$— 一 * 一 
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4dyw-x-y-z-l 











9 

6 def f10: 
/x-y-z-2 
8 

9 def £20): 
10y=2=38 
11 

12 def £30: 
l3z=4 


了 * 


14 print output % Cw’, id(w), w) 

15 print output % Cx’, id(x), x) 

16 print output % Cy’, id(y), y) 

17 print output % Cz’, id(z), z) 

18 

19 clo = f3. func closure 

20 if clo: 

21 print “f3 closure vars:^, [str(c) for c in cloj 
22 else: 

23 print “no f3 closure vars^ 

24 f30 

25 

26 clo = fZ. func closure 

27 if clo: 

28 print “f2 closure vars:^, [str(c) for c in clo] 
29 else: 

30 print “no f2 closure vars” 

31 £20 

32 

33 clo = fl. func closure 

34 if clo: 

35 print “f1 closure vars:/, [str(c) for c in clo/ 
36 else: 

37 print “no fl closure vars” 

38 £10 


逐 行 解释 


Lines 1-4 
这 段 脚本 由 创建 模板 来 输出 一 个 变量 开始 : 它 的 名 字 ，ID， 以 及 值 ， 然 后 设置 变量 w x, y 和 zo 
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我 们 定义 了 模板 ， 这 样 便 不 需要 多 次 拷贝 相同 输出 格式 的 字符 串 


Lines 6-9, 26-31 

£10 函数 的 定义 包括 创建 一 个 局 部 变量 x, y 和 z 以 及 一 个 内 部 函数 £20 的 定义 。( 注 意 所 有 的 
局 部 变量 遮蔽 或 者 隐藏 了 对 他 们 同名 的 全 局 变量 的 访问 )。 如 果 £20) 使 用 了 任何 的 定义 在 £10 作用 
域 的 变量 , 比如 说 , 非 全 局 的 和 非 £2 O 的 局 部 域 的 , 那么 它们 便 是 自由 变量 , 将 会 被 f1. func. closure 
追踪 到 。 


















































Lines 9- 10，19 - 24 

这 几 行 实际 上 是 对 £10 的 拷贝 ,对 £20 做 相同 的 事 ， 定 义 了 局 部 变量 y 和 z， 以 及 对 一 个 内 部 
函数 £30. 此 外 ， 这 里 的 局 部 变量 会 遮蔽 全 局 以 及 那些 在 中 间 局 部 化 作用 域 的 变量 ， 比 如 ，fl 0 的 。 
如 果 对 于 f3 OO 有 任何 的 自由 变量 ， 他 们 会 在 这 里 显示 出 来 。 












































毫 无 疑问 ， 你 会 注意 到 对 自由 变量 的 引用 是 存储 在 单元 对 象 里 ， 或 者 简单 的 说 ， 单 元 。 这 些 东 
西 是 什么 呢 ? 单元 是 在 作用 域 结束 后 使 自由 变量 的 引用 存活 的 一 种 基础 方法 。 

















举例 来 说 ， 我 们 假设 函数 f3 () 已 经 被 传 入 到 其 他 一 些 函数 ， 这 样 便 可 在 稍 后 ， 甚 至 是 £20 完成 
之 后 ， 调 用 它 。 你 不 想 要 让 £20 的 栈 出 现 ， 因 为 即使 我 们 仅仅 在 乎 f3 O 使 用 的 自由 变量 ， 栈 也 会 让 
所 有 的 f2(0 s 的 变量 保持 存活 。 单 元 维持 住 自 由 变量 以 便 f2 0 的 剩余 部 分 能 被 释放 措 。 



































$ Lines 12=17 E 
这 个 部 分 描绘 了 f3 0 的 定义 ， 创 建 一 个 局 部 的 变量 z。 接 着 显示 wx y z， 这 4 个 变量 从 最 内 
部 作用 域 逐 步 向 外 的 追踪 到 的 。 在 f30, £20, XE fl 9 中 都 是 找 不 到 变量 w 的 ， 所 以 ， 这 是 个 全 
局 变量 。 在 £30 或 者 £20 F, 找 不 到 变量 x， 所 以 来 自 fl 0 的 闭 包 变 量 。 相似 地 , y 是 一 个 来 自 £20 
的 闭 包 变量 。 最 后 ，z 是 f30 的 局 部 变量 。 




















Lines 33 - 38 

main ) 中 剩余 的 部 分 尝试 去 显示 fl 0 的 财 包 变量 ， 但 是 什么 都 不 会 发 生 因为 在 全 局 域 和 fl 0 的 
作用 域 之 间 没 有 任何 的 作用 域 -一 没有 f10 可 以 借用 的 作用 域 , 因此 不 会 创建 闭 包 --- 所 以 第 34 行 的 
条 件 表达 式 永远 不 会 求 得 True。 这 里 的 这 段 代 码 仅仅 是 有 修饰 的 目的 。 

















* 高 级 闭 包 和 装饰 器 的 例子 


回 到 11.3.6 部 分 ,我们 看 到 了 一 个 使 用 闭 包 和 装饰 器 的 简单 例子 ，deco. py。 接 下 来 就 是 稍微 
高 级 点 的 例子 ， 来 给 你 演示 闭 包 的 真正 的 威力 。 应 用 程序 “1ogs” 函数 调用 。 用 户 选 择 是 要 在 函数 调 
用 之 前 或 者 之 后 ， 把 函数 调用 写 入 日 志 。 如 果 选 择 贴 日 志 ， 执 行 时 间 也 会 显示 出 来 。 

















例子 11.8 用 闭 包 将 函数 调用 写 入 日 至 。 
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这 个 例子 演示 了 带 参数 的 装饰 器 ， 该 参数 最 终 决 定 哪 一 个 闭 包 会 被 用 的 。 这 也 是 闭 包 的 威力 的 
特征 。 








7 #!/usr/bin/env python 

2 

3 from time import time 

4 

5 def logged (when): 

6 def log(f, xargs, **kargs): 

7 print '''Called: 

8 function: %s 

9 args: “r 

10 kargs: U’’’ % (f, args, kargs) 
Il 

12 def pre logged(f): 

13 def wrapper (xargs, **kargs): 
14 log(f, xargs, **kargs) 

15 return f(*args, **kargs) 

16 return wrapper 

17 

18 def post logged(f): 

19 def wrapper (*args, **kargs): 
20 now = time() 

21 try: 

22 return f(*args, **kargs) 

23 finally: 

24 log(f, *args, **kargs) 

25 print “time delta: fís^ % (time ()-now) 
26 return wrapper 

27 

28 try: 

29 return (/pre^: pre logged, 

30 “post”: post logged} [when] 

31 except KeyError, e: 

32 raise ValueError(e), 'must be “pre” or “post~’ 
dO. 

34 logged (“post”) 

35 def hello (name): 

36 print “Hello, ^ name 
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38 hello( World! ^) 





如 果 执 行 这 个 脚本 ， 你 将 会 得 到 和 下 面相 似 的 输出 : 


$ funcLog.py Hello, World! Called: 
function: <function hello at 0x555f0» 
args: (World!’,) 

kargs: O 

time delta: 0. 000471115112305 


逐 行 解释 


Lines 5-10, 28-32 

这 段 代 码 描绘 了 logged O 函数 的 核心 部 分 ， 其 职责 就 是 获得 关于 何 时 函数 调用 应 该 被 写 入 日 志 
VUA M M AM eR QUE PM ERE UE ae 
部 函数 : logO,pre loggedO 以 及 post loggedO . logO Xi EACH SABER C. EMME 
示 标 准 输出 函数 的 名 字 和 参数 。 如 果 你 愿意 在 “真实 的 世界 中 ”使 用 该 函数 的 话 ， 你 很 有 可 能 会 把 
输出 写 到 一 个 文件 ， 数 据 库 ， 或 者 标准 错误 (sys. stderr). loggedQ fF 28-32 行 的 最 后 的 部 分 实际 
上 是 函数 中 非 函 数 声 明 的 最 开始 的 代码 。 读 取 用 户 的 选择 然后 返回 *logged O 函数 中 的 一 个 便 能 


A presi HIF. 
Lines 12 - 26 
pre_logged() 和 post logged 0 都 会 包装 目标 函数 然后 根据 它 的 名 字 写 入 日 志 ， 比 如 ， 当 目标 函 
数 已 经 执行 之 后 ，post_loggeed (会 将 函数 调用 写 入 日 志 ， 而 pre_logged (0) 则 是 在 执行 之 前 。 






































根据 用 户 的 选择 ，pre_logged(0) 和 post_logged( 其 中 之 一 会 被 返回 。 当 这 个 装饰 器 被 调用 的 时 
候 ， 首 先 对 装饰 器 和 其 参数 进行 求 值 ， 比 如 logged (什么 时 候 )。 然 后 返回 的 函数 对 象 作为 目标 的 函 
数 的 参数 进行 调用 ， 比 如 ，pre logged(f) 或 者 post _ logged (f)， 

两 个 *logged (函数 都 包括 了 一 个 名 为 wrapper 0 的 闭 包 。 当 合适 将 其 写 入 日 志 的 时 候 ， 它 便 会 
调用 目标 函数 。 这 个 函数 返回 了 包 右 好 的 函数 对 象 ， 该 对 象 随后 将 被 重新 赋值 给 原始 的 目标 函数 标 
识 符 。 














Lines 34- 38 

这 段 脚 本 的 主要 部 分 简单 地 装饰 了 hello 0 〇 函数 并 将 用 修改 过 的 函数 对 象 一 起 执行 它 。 当 你 在 
38 行 调用 hello O 的 时 候 ， 它 和 你 在 35 行 创建 的 函数 对 象 已 经 不 是 一 回 事 了 。34 行 的 装饰 器 用 特殊 
的 装饰 将 原始 函数 对 象 进行 了 包裹 并 返回 这 个 包 于 后 的 hello (0 版 本 。 

















11. 8.5 作用 域 和 lambda 
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python 的 lambda 匿名 函数 遵循 和 标准 函数 一 样 的 作用 域 规则 。 一 个 Lambda 表达 式 定义 了 新 的 
作用 域 ， 就 像 函数 定义 ， 所 以 这 个 作用 域 除了 局 部 lambda/ 函数 ， 对 于 程序 其 他 部 分 ， 该 作用 域 都 是 





不 能 对 进行 访问 的 。 
那些 声明 为 函数 局 部 变量 的 














lambda 表达 式 在 这 个 函数 体内 是 可 以 访问 的 ; 然而 ， 在 lambda 语 


名 中 的 表达 式 有 和 函数 相同 的 作用 域 。 你 也 可 以 认为 函数 和 一 个 Lambda 表达 式 是 同胞 。 





x = I0 
def foo(): 
ge 


bar = lambda :x*y 
print bar() 


我 们 现在 知道 这 段 代码 能 很 好 的 运行 。 


22» foo0 
15 


..……. 然而 ， 我 们 必须 在 回顾 下 过 去 ， 去 看 下 原来 的 python 版 本 中 让 代码 运行 必需 的 ， 一 种 极 
其 普遍 的 做 法 ,在 2. 1 之 前 , 我 们 将 会 得 到 一 个 错误 , 如 同 你 在 下 面 看 到 的 一 样 , 因为 函数 和 Lambda 
都 可 访问 全 局 变量 ， 但 两 者 都 不 能 访问 彼此 的 局 部 作用 域 。 





22 fool 
Traceback (innermost las 








D 


File &stdin^/^, line L in ? 
File “<stdim”, line 4, in foo 


File ^&«stdin^^, line 3, 


NameError: y 





in <lambda 





在 上 面 的 例子 中 ， 虽 然 lambda 表达 式 在 foo O 的 局 部 作用 域 中 创建 ， 但 他 仅仅 只 能 访问 两 个 作 
用 域 : 它 自 己 的 局 部 作用 域 和 全 局 的 作用 域 (同样 见 Section 11.8.3). 解决 的 方法 是 加 入 一 个 变量 








作为 默认 参数 ， 这 样 我 们 便 能 从 








外 面 的 局 部 作用 域 传 递 一 个 变量 到 内 部 。 在 我 们 上 面 的 例子 中 ， 我 


们 将 lambda 的 那 一 行 修改 成 这 样 : 


bar = lambda y-y: xty 


由 于 这 个 改变 ， 程 序 能 运行 
的 局 部 变量 )。 你 可 以 在 所 有 你 和 
变 外 部 y 值 的 可 能 性 ， 比 如 : 





x = I0 








了 。 外 部 y 的 值 会 作为 一 个 参数 传 入 ， 成 为 局 部 的 y (lambda 函数 
到 的 python 代码 中 看 到 这 种 普遍 的 做 法 ， 然 而 ， 这 不 表明 存在 改 











Edit By Vheavens 


Edit By Vheavens 


ee 
T 


def foo(): 
p 
bar = lambda y-y: xty 





print bar 
pc 
print bar 0 


输出 “完全 错误 “ 


22» foo 
15 
15 


原因 是 外 部 y 的 值 被 传 入 并 在 lambda 中 “设置 “， 所 以 虽然 其 值 在 稍 后 改变 了 ， 但 是 lambda 
的 定义 没有 变 。 那 时 唯一 蔡 代 的 方案 就 是 在 lambda 表达 式 中 加 入 对 函数 局 部 变量 y 进行 引用 的 局 部 


变量 Zo 











x = I0 
def foot): 


y um 
bar = lambda z:xtz 
print bar (y) 


y=8 
print bar (y) 











为 了 获得 正确 的 输出 所 有 的 一 切 都 是 必需 的 : 








22» foo 
15 
18 





这 同样 也 不 可 取 因 为 现在 所 有 调用 bar 0 的 地 方 都 必需 改 为 传 入 一 个 变量 。 从 python2. 1 开始 ， 
在 没有 任何 修改 的 情况 下 整个 程序 都 完美 的 运行 。 














x = I0 
def foo(): 
Pog 


bar = lambda :x*y 
print bar (y) 
y=8 
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print bar (y) 

















DS» fool 

15 

18 

EMM MAREK Gia) 被 加 入 到 python 中 ， 你 会 不 高 兴 吗 ? VS EAE. PAV 








在 pep227 中 阅读 到 更 多 关于 这 个 重要 改变 的 信息 。 
11.8.6 变量 作用 域 和 名 字 空 间 。 


从 我 们 在 这 章 的 学 习 中 ， plaice SUN 总 有 一 个 或 者 两 个 活动 的 作用 域 -一 不 多 ， 不 
少 。 S rl a ， 要 么 在 个 我 们 能 访问 函数 局 部 作用 域 和 全 
局 作用 域 的 函数 体内 执行 。 E E 























从 11.8.1 人 小节 的 核心 笔记 中 ， 我 们 也 可 以 发 现 ， 在 任何 给 定 的 时 间 ， 存 在 两 个 或 者 三 个 的 活动 
的 名 字 空 间 。 从 函数 内 部 ， 局 部 作用 域 包围 了 局 部 名 字 空 间 ， 第 一 个 搜寻 名 字 的 地 方 。 如 果 名 字 存 
在 的 话 ， 那 么 将 跳 过 检查 全 局 作用 域 (全 局 和 内 建 的 名 字 空 间 ) 


























给 读者 。 


我 们 现在 将 给 出 例子 11.9, 一 个 到 处 混合 了 作用 域 的 脚本 。 我们 将 确定 此 程序 输出 作为 练习 留 E 


例子 11.9 变量 作用 域 (scope. py) 

















局 部 变量 隐藏 了 全 局 变量 ， 正 如 在 这 个 变量 作用 程序 中 显示 的 。 程 序 的 输出 会 是 什么 呢 ? 《以 
及 为 什么 ) 


l#!/usr/bin/env python 


2i LN 

3 

4def procl(): 

5 

67, k=3, 4 

7print ^j == %d and k == Wd^ % G, k) 
8&k=5 

9 


def proc2(): 
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12 
13 
14 
15 
16 
17 
18 
19 
20 
21 
22 
23 
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JB 
proci Q 
print ^j == %d and k == Wd^ % (G, k) 


ey 
proci (Q 
print ^j == %d and k == Wd^ 8 (G, k) 


Jg 
procZ () 
print ^j == fd and k == %d” % G k) 


12. 3. 1 小 节 有 更 多 关于 名 字 空 间 和 变量 作用 域 的 信息 。 








11.9 x% 


如 果 函 数 包 含 了 对 其 自身 的 调用 ,该 函数 就 是 递归 的 。 根据 Aho,，Sethi， 和 Ullman，”[aj] 如 











递归 广泛 地 应 用 于 语言 识别 和 使 用 递归 函数 的 数学 应 用 中 。 在 本 文 的 早先 部 分 ， 我 们 第 一 次 看 


果 一 个 新 的 调用 能 在 相同 过 程 中 较 早 的 调用 结束 之 前 开始 ， 那 么 该 过 程 就 是 递归 的 “ 


到 了 我 们 定义 的 阶乘 函数 





N! ? factorial N) ? 1*25*3...*N 





我 们 可 以 用 这 种 方式 来 看 阶乘 : 


factorial(N) = N! 
=N * (N-I)! 
=N x (N-1) x (N-2)! 


=N * N-D) * NZ)... %3 RFLZ*I 


我 们 现在 可 以 看 到 阶乘 是 递归 的 ， 因 为 factorial (N) = N* factorial (N-1). 换 句 话说 ， 为 了 获 
得 factorial (N) 的 值 ， 需 要 计算 factorial (N-1). 而且， 为 了 找到 factorial (N-1) ， 需 要 计算 
factorial(N-2) 等 等 。 我 们 现在 给 出 阶乘 函数 的 递归 版 本 。 











def factorial(n): 
if n--0orn-—-[1: £0! - I! - [| 
return 1 
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else: 
return (n * factorial (n-1)) 


11. 10 生成 器 





早先 在 第 8 35. BUND f XET SRI IH OE AE ANT BH fT ZR AE FH RS SR — RI IS 
器 接口 。 这 很 容易 明白 因为 他 们 仅仅 只 有 一 个 方法 ， 用 于 调用 获得 下 个 元 素 的 next O 

















然而 ， 除 非 你 实现 了 一 个 迭代 器 的 类 ， 迭 代 器 真正 的 并 没有 那么 “聪明 “。 难 道 调用 函数 还 没 
有 强大 到 在 迭代 中 以 某 种 方式 生成 下 一 个 值 并 且 返 回 和 next O 调用 一 样 简 单 的 东西 ? 那 就 是 生成 器 
的 动机 之 一 。 

生成 器 的 另外 一 个 方面 甚至 更 加 强力 ..... 协同 程序 的 概念 。 协 同 程序 是 可 以 运行 的 独立 函数 调 
用 ， 可 以 暂停 或 者 挂 起 ， 并 从 程序 离开 的 地 方 继续 或 者 重新 开始 。 在 有 调用 者 和 【被 调用 的 ) 协同 
程序 也 有 通信 。 举 例 来 说 ， 当 协同 程序 暂停 的 时 候 ， 我 们 能 从 其 中 获得 一 个 中 间 的 返回 值 ， 当 调用 
回 到 程序 中 时 ， 能 够 传 入 额外 或 者 改变 了 的 参数 ， 但 仍 能 够 从 我 们 上 次 离开 的 地 方 继续 ， 并 且 所 有 
状态 完整 。 挂 起 返回 出 中 间 值 并 多 次 继续 的 协同 程序 被 称 为 生成 器 ， 那 就 是 python 的 生成 器 真正 在 
做 的 事 。 在 2. 2 的 时 候 ， 生 成 器 被 加 入 到 python 中 接着 在 2. 3 中 成 为 标准 〈 见 PEP255) ， 虽 然 之 前 
足够 强大 ， 但 是 在 Python2. 5 的 时 候 ， 得 到 了 显著 的 提高 〈 见 pep342) 。 这 些 提升 让 生成 器 更 加 接 
近 一 个 完全 的 协同 程序 ， 因 为 允许 值 (和 异常 ) 能 传 回 到 一 个 继续 的 函数 中 。 同 样 地 ， 当 等 待 一 个 
生成 器 的 时 候 ， 生 成 器 现在 能 返回 控制 。 在 调用 的 生成 器 能 挂 起 〈 返 回 一 个 结果 ) 之 前 ， 调 用 生成 
器 返回 一 个 结果 而 不 是 阻塞 等 待 那个 结果 返回 。 让 我 们 更 进一步 观察 生成 器 自 顶 向 下 的 启动 . 

什么 是 python 式 的 生成 器 ? 从 名 法 上 讲 ， 生 成 器 是 一 个 带 yield 语句 的 函数 。 一 个 函数 或 者 子 
程序 只 返回 一 次 ,但 一 个 生成 器 能 暂停 执行 并 返回 一 个 中 间 的 结 那 就 是 yield 语句 的 功能 ， 返 
回 一 个 值 给 调用 者 并 暂停 执行 。 当 生成 器 的 next 0 方法 被 调用 的 时 候 ， 它 会 准确 地 从 离开 地 方 继 续 
( 当 它 返回 [一 个 值 以 及 ] 控 制 给 调用 者 时 ) 

当 在 2.2 生成 器 被 加 入 的 时 候 ， 因 为 它 引 入 了 一 个 新 的 关键 字 ，yield， 为 了 向 下 兼容 ， 你 需要 
M_future 模块 中 导入 generators 来 使 用 生成 器 。 从 2. 3 开始 ， 当 生成 器 成 为 标准 的 时 候 ， 这 就 不 
再 是 必需 的 了 。 













































































11. 10. 1. 简单 的 生成 器 特性 








与 迭代 器 相似 ， 生 成 器 以 另外 的 方式 来 运作 : 当 到 达 一 个 真正 的 返回 或 者 函数 结束 没有 更 多 的 
值 返回 〈 当 调用 next 0)， 一 个 StopIteration 异常 就 会 抛 出 。 这 里 有 个 例子 ， 简 单 的 生成 器 : 





def simpleGen(): 
yield 1 
yield '2 ——> punch!’ 
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现在 我 们 有 自己 的 生成 器 函数 ， 让 我 们 调用 他 来 获得 和 保存 一 个 生成 器 对 象 (以 便 我 们 能 调用 它 
的 next () 方 法 从 这 个 对 象 中 获得 连续 的 中 间 值 ) 














2» myG = simpleGen Q) 

222 myG. next () 

1 

222 myG. next () 

'2 —5 punch!’ 

222 myG. next () 

Traceback (most recent call last): 
File ^^ line 1, in ? 


myG. next () StopIteration 





由 于 python 的 for 循环 有 next O 调用 和 对 StopIteration 的 处 理 , 使 用 一 个 for 循环 而 不 是 手 
动 友 代 穿 过 一 个 生成 器 〈 或 者 那 种 事物 的 迭代 器 ) 总 是 要 简洁 漂亮 得 多 。 














22^ for eachItem in simpleGen(): 
print eachltem 


1 
: '2 ——> punch!’ : 


PRK ETERNAL R ERER? AEL EL BEI NE RF JU, 
而 这 需要 函数 威力 而 不 是 已 经 在 某 个 序列 中 静态 对 象 。 








在 接 下 来 的 例子 中 ， 我 们 将 要 创建 一 个 带 序 列 并 从 那个 序列 中 返回 一 个 随机 元 素 的 随机 达 代 器 : 





from random import randint 

def randGen(aList): 

while len(aList) > 0: 

yield alist. pop(randint (0, len(aList))) 











不 同 点 在 于 每 个 返回 的 元 素 将 从 那个 队列 中 消失 ， 像 一 个 1ist. pop () M random. choice 0 的 结 


合 的 归 类 。 


22^ for item in randGen([’rock’, 'paper', 'scissors' J): 
print item 


SCÍSSOLS 


rock 
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paper 





在 接 下 来 的 几 章 中 ， 当 我 们 谈 到 面向 对 象 编 程 的 时 候 ， 将 看 见 这 个 生成 器 较 简单 〈 和 无 限 ) 的 
版 本 作为 类 的 达 代 器 。 在 几 章 前 的 8. 12 小 节 中 ， 我 们 讨论 了 生成 器 表达 式 的 语法 。 使 用 这 个 语法 返 
回 的 对 象 是 个 生成 器 ， 但 只 以 一 个 简单 的 形式 ， 并 人 允许 使 用 过 分 简单 化 的 列表 解析 的 语法 。 





这 些 简单 的 例子 应 该 让 你 有 点 明白 生成 器 是 如 何 工 作 的 ， 但 你 或 许 会 问 。 “在 我 的 应 用 中 ， 我 可 
以 在 哪 使 用 生成 器 ? “或 许 ， 你 会 问 “ 最 适合 使 用 这 些 个 强大 的 构建 的 地 方 在 哪 ? “ 








使 用 生成 器 最 好 的 地 方 就 是 当 你 正夫 代 穿越 一 个 巨大 的 数据 集合 ， 而 重复 达 代 这 个 数据 集合 是 
一 个 很 膝 烦 的 事 ， 比 如 一 个 巨大 的 磁盘 文件 ， 或 者 一 个 复杂 的 数据 库 查 询 。 对 于 每 行 的 数据 ， 你 希 
望 执行 非 元 素 的 操作 以 及 处 理 ， 但 当 正 指向 和 从 代 过 它 的 时 候 ， 你 “不 想 失 去 你 的 地 条 “。 








你 想 要 抓 取 一 块 数据 ， 比 如 ， 将 它 返 回 给 调用 者 来 处 理 以 及 可 能 的 对 《另外 一 个 ) 数据 库 的 插 
入 ， 接 着 你 想 要 运行 一 次 next 0 来 获得 下 一 块 的 数据 ， 等 等 。 状 态 在 挂 起 和 再 继续 的 过 程 中 是 保留 
了 的 ， 所 以 你 会 觉得 很 舒服 有 一 个 安全 的 处 理 数据 的 环境 。 没 有 生成 器 的 话 ， 你 的 程序 代码 很 有 可 
能 会 有 很 长 的 函数 ， 里 面 有 一 个 很 长 的 循环 。 当 然 ， 这 仅仅 是 因为 一 个 语言 这 样 的 特征 不 意味 着 你 
需要 用 它 。 如 果 在 你 程序 里 没有 明显 适合 的 话 ， 那 就 别 增加 多 余 的 复杂 性 ! 当 你 遇 到 合适 的 情况 时 ， 
你 便 会 知道 什么 时 候 生 成 器 正 是 要 使 用 的 东西 。 






























































11. 10.2 加 强 的 生成 器 特性 * 


在 python2.5 中， 一 些 加 强 特性 加 入 到 生成 器 中 ， 所 以 除了 next 0 来 获得 下 个 生成 的 值 ， 用 户 
可 以 将 值 回 送 给 生成 器 [sendO]， 在 生成 器 中 抛 出 异常 ， 以 及 要 求生 成 器 退出 [close C ] 





由 于 双向 的 动作 涉及 到 叫做 send O 的 代码 来 向 生成 器 发 送 值 〈 以 及 生成 器 返回 的 值 发 送 回来 )， 
现在 yield 语句 必须 是 一 个 表达 式 ， 因 为 当 回 到 生成 器 中 继续 执行 的 时 候 ， 你 或 许 正 在 接收 一 个 进 
入 的 对 象 。 下 面 是 一 个 展示 了 这 些 特性 的 ， 简 单 的 例子 。 我 们 用 简单 的 闭 包 例 子 ，counter: 


def counter(start at=0): 
count = start at 
while True: 
val = (yield count) if val is not None: 
count = val 
else: 
count += 1 


生成 器 带 有 一 个 初始 化 的 值 ， 对 每 次 对 生成 器 [next O ] 调 用 以 1 累加 计数 。 用 户 已 可 以 选择 重 
置 这 个 值 ， 如 果 他 们 非常 想 要 用 新 的 值 来 调用 send O 不 是 调用 next () 。 这 个 生成 器 是 永远 运行 的 ， 








$ 
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所 以 如 果 你 想 要 终结 它 ， 调 用 closeO 方法。 如果 我 们 交互 的 运行 这 段 代 码 ， 会 得 到 如 下 输出 : 

















22» count = counter (5) 
222 count. next () 


222 count. next () 
>> count. send (9) 
222 count. next () 


222 count. close Q) 

222 count. next () 

Traceback (most recent call last): 
File “<stdim”, line 1, in <module> 
Stoplteration 


你 可 以 在 PEP AY 255 和 342 中 ， 以 及 给 读者 介绍 python2. 2 中 新 特性 的 linux 期 刊 文章 中 阅读 
到 更 多 关于 生成 器 的 资料 : 


http://www. linux journal. com/article/5597 


11.11 练习 


11 - 1. 参数 。 比 较 下 面 3 个 函数 : 
def countToFourl(): 

for eachNum in range(5): 
print eachNum, 


def countToFour2 (n): 
for eachNum in range(n, 5): 
print eachNum, 


def countToFour3 (n-1): 

for eachNum in range(n, 5): 

print eachNum, 

给 定 如 下 的 输入 直到 程序 输出 ， 你 认为 什么 会 发 生 ? 向 下 表 11.2 填 入 输出 。 如 果 你 认为 给 定 的 
输入 会 发 生 错误 的 话 填 入 “ERROR“ 或 者 如 果 没 有 输出 的 话 填 入 “NONE” 
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11-2. 函数 。 结 合 你 对 练习 5-2 的 解 ， 以 便 你 创建 一 个 带 相同 对 数字 并 同时 返回 一 它们 之 和 以 及 
产物 的 结合 函数 。 
表 11.2 问题 11-1 的 输出 图 


Table 11.2 Output Chart for Problem | 1-1 


Input countToFourl count ToFour2 countToFour3 











2 
4 
5 


(nothing) 


11-3 函数 。 在 这 个 练习 中 ， 我 们 将 实现 max OM min O 内 建 函 数 。 

(a) 写 分 别 带 两 个 元 素 返 回 一 个 较 大 和 较 小 元 素 ， 简 单 的 max2 () 核 min2 () 函数 。 他 们 应 该 可 以 
用 任意 的 python 对 象 运 作 。 举 例 来 说 ，max2 (4, 8) F min? (4, 8) 会 各 自 每 次 返回 8 和 4。 
+ (b) 创建 使 用 了 在 a 部 分 中 的 解 来 重 构 max O 和 min O 的 新 函数 my. max O 和 my_min(). HERR 














数 分 别 返回 非 空 队列 中 一 个 最 大 和 最 小 值 。 它 们 也 能 带 一 个 参数 集合 作为 输入 。 用 数字 和 字符 串 来 
测试 你 的 解 。 











11-4. 返回 值 。 给 你 在 5-13 的 解 创建 一 个 补充 函数 。 创 建 一 个 带 以 分 为 单位 的 总 时 间 以 及 
返回 一 个 以 小 时 和 分 为 单位 的 等 价 的 总 时 间 。 


Il-59. 
i 


默认 参数 ,更 新 你 在 练习 5-7 中 创建 的 销售 税 脚本 以 便 让 销售 税率 不 再 是 函数 输入 的 必要 之 物 。 
创建 使 用 你 地 方 税率 的 默认 参数 如 果 在 调用 的 时 候 没 有 值 传 入 。 

















11-6. 变 长 参数 。 下 一 个 称 为 printf O 的 函数 。 有 一 个 值 参数 ， 格 式 字符 串 。 剩 下 的 就 是 根 
据 格式 化 字符 串 上 的 值 ， 要 显示 在 标准 输出 上 的 可 变 参数 ， 格 式 化 字符 串 中 的 值 允许 特别 的 字符 串 
格式 操作 指示 符 ， 如 %d，%f，etc。 提 示 : 解 是 很 琐碎 的 ---- 无 需 实现 字符 串 操作 符 功能 性 ， 但 你 需 
要 显示 用 字符 串 格式 化 操作 (%) 





11-7. 用 mapO 进行 函数 式 编程 。 给 定 一 对 同一 大 小 的 列表 ， 如 [1，2，3] 和 
Pabe,’ def," ghi’,.... ]， 将 两 个 标 归 并 为 一 个 由 每 个 列表 元 素 组 成 的 元 组 的 单一 的 表 ， 以 使 我 
们 的 结果 看 起 来 像 这 样 : (L0, " abe), (2, def’), (3, ’ghi’), ...}. (虽然 这 问题 在 本 质 上 和 
第 六 章 的 一 个 问题 相似 ， 那 时 两 个 解 没 有 直接 的 联系 ) 然后 创建 用 zip 内 建 函 数 创 建 男 一 个 解 。 
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11-8. 用 filer0 〇 进行 函数 式 编程 . 使 用 练习 5-4 你 给 出 的 代码 来 决定 头 年 。 和 更 新 你 的 代码 一 
边 他 成 为 一 个 函数 如 果 你 还 没有 那么 做 的 话 。 然 后 写 一 段 代码 来 给 出 一 个 年 份 的 列表 并 返回 一 个 只 
有 间 年 的 列表 。 然 后 将 它 转 化 为 用 列表 解析 。 











11-9. H reduce O 进行 函数 式 编程 。 复 习 11.7. 2 部 分 ， 阐 述 如 何 用 reduce 0 数字 集合 的 累 
加 的 代码 。 修 改 它 ， 创 建 一 个 叫 average () 的 函数 来 计算 每 个 数字 集合 的 简单 的 平均 值 。 














11 - 10. 用 filter (0 进行 函数 式 编程 。 在 unix 文件 系统 中 ， 在 每 个 文件 夹 或 者 目录 中 都 有 两 个 
特别 的 文件 :“， 表示 现在 的 目录 ,“. 表示 父 目录 。 给 出 上 面 的 知识 ， 看 下 os. listdir O 函数 的 文 
档 并 描述 这 段 代码 做 了 什么 : 

files = filter(lambda x: x and x[0] /= '.', os. listdir(folder)) 

















11 - 11. H map( 进 行 函数 式 编程 。 写 一 个 使 用 文件 名 以 及 通过 除去 每 行 中 所 有 排头 和 最 尾 的 空 
白 来 清洁“ 文件 。 在 原始 文件 中 读 取 然后 写 入 一 个 新 的 文件 ， 创 建 一 个 新 的 或 者 覆盖 掉 已 存在 的 。 
给 你 的 用 户 一 个 选择 来 决定 执行 哪 一 个 。 将 你 的 解 转换 成 使 用 列表 解析 。 

















11-12. 传递 函数 。 给 在 这 章 中 描述 的 testit 0 〇 函数 写 一 个 姊妹 函数 。timeit () 会 带 一 个 函数 
对 象 〈 和 参数 一 起 ) 以 及 计算 出 用 了 多 少时 间 来 执行 这 个 函数 ， 而 不 是 测试 执行 时 的 错误 。 返 回 下 
面 的 状态 : 函数 返回 值 ， 消 耗 的 时 间 。 你 可 以 用 time. clock (或 者 time. time () ， 无 论 哪 一 个 给 你 
提供 了 较 高 的 精度 。( 一 般 的 共识 是 在 POSIX 上 用 time. time (), Æ win32 系统 上 用 time.clock(O ) 
注意 : timeit O 函数 与 timeit 模块 不 相关 (在 python2. 3 中 引入 ) 



































11 - 13. 使 用 reduce () 进行 函数 式 编程 以 及 递归 。 在 第 8 张 中 ， 我 们 看 到 N 的 阶乘 或 者 N! 作 为 
从 1 到 N 所 有 数字 的 乘积 。 

(a) 用 一 分 钟 写 一 个 带 x, y 并 返回 他 们 乘积 的 名 为 mult (x, y) 的 简单 小 巧 的 函数 。 

(b) HRE a 中 创建 mult O 函数 以 及 reduce 来 计算 阶乘 。 

(c) 彻底 抛弃 掉 mult O 的 使 用 ， 用 lamda KARER. 

(qd) 在 这 章 中 ,我 们 描绘 了 一 个 递归 解决 方案 来 找到 N! 用 你 在 上 面 问题 中 完成 的 timeit () 函数 ， 
并 给 三 个 版 本 阶乘 函数 计时 (迭代 的 ，reduce O 以 及 递归 ) 

















11 - 14， 递 归 。 我 们 也 来 看 下 在 第 八 章 中 的 Fibonacci 数字 。 重 写 你 先前 计算 Fibonacci 数字 
的 解 (练习 8-9) 以 便 你 可 以 使 用 递归 。 





11 - 15. 递归 。 从 写 练习 6-5 的 解 ， 用 递归 向 后 打印 一 个 字符 串 。 用 递归 向 前 以 及 向 后 打印 一 个 
字符 串 。 





11 - 16， 更 新 easyMath. py。 这 个 脚本 ， 如 例子 11.1 描绘 的 那样 ， 以 入 门 程序 来 帮助 年 轻 人 强 
化 他 们 的 数学 技能 。 通 过 加 入 乘法 作为 可 支持 的 操作 来 更 进一步 提升 这 个 程序 。 额 外 的 加 分 : 也 加 
入 除法 ; 这 比较 难 做 些 因 为 你 要 找到 有 效 的 整数 除数 。 笠 运 的 是 ,已 经 有 代码 来 确定 分 子 比 分 母 大 ， 
所 以 不 需要 支持 分 数 。 
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11-17. 定义 

(a) fix ER BOM YA A currying 之 间 的 区 别 。 
(b) 偏 函数 应 用 和 闭 包 之 间 有 什么 区 别 ? 
(c) 最 后 ， 和 迭代 器 和 生成 器 是 怎么 区 别 开 的 ? 











11 - 18.， 同 步 化 函数 调用 。 复 习 下 第 六 章 中 当 引 入 浅 拷贝 和 深 堵 贝 的 时 候 ， 提 到 的 丈夫 和 妻子 
情形 (6. 20 小 结 )。 他 们 共用 了 一 个 普通 账户 ， 同 时 对 他 们 银行 账户 访问 时 会 发 生 不 利 影响 。 











创建 一 个 程序 ， 让 调用 改变 账户 收 支 的 函数 必需 同步 。 换 句 话说 ， 在 任意 如 








全 定时 刻 只 能 有 个 
一 进程 或 者 线程 来 执行 函数 。 一 开始 你 试 着 用 文件 ， 但 是 一 个 真正 的 解决 方法 是 用 装饰 器 和 在 


threading 或 者 mutex 模块 中 的 同步 指令 。 你 看 看 第 17 张 来 获得 更 多 的 灵感 。 
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模块 


章 主题 
什么 是 模块 ? 
模块 和 文件 
命名 空间 

导入 模块 

导入 模块 属性 
模块 内 建 函数 包 
模块 的 其 他 特性 
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本 章 将 集中 介绍 Python 模块 和 如 何 把 数据 从 模块 中 导入 到 编程 环境 中 。 同 时 也 会 涉及 包 的 相 
关 概 念 。 模 块 是 用 来 组 织 Python 代码 的 方法 ， 而 包 则 是 用 来 组 织 模块 的 。 本 章 最 后 还 会 讨论 一 些 
与 模块 有 关 的 其 他 方面 的 问题 


12.1 什么 是 模块 E 


模块 支持 从 逻辑 上 组 织 Python 代码 。 当代 码 量变 得 相当 大 的 时 候 ， 我 们 最 好 把 代码 分 成 一 
些 有 组 织 的 代码 段 ， 前 提 是 保证 它们 的 彼此 交互 。 这 些 代 码 片 段 相 互 间 有 一 定 的 联系 ， 可 能 是 一 个 
包含 数据 成 员 和 方法 的 类 ， 也 可 能 是 一 组 相关 但 彼此 独立 的 操作 函数 。 这 些 代码 段 是 共享 的 ， 所 以 
Python 人 允许 “ 调 入 ”一 个 模块 ， 人 允许 使 用 其 他 模块 的 属性 来 利用 之 前 的 工作 成 果 ， 实 现代 码 重 用 . 
这 个 把 其 他 模块 中 属性 附加 到 你 的 模块 中 的 操作 叫做 导入 (import) 。 那 些 自我 包含 并 且 有 组 织 的 代 
码 片断 就 是 模块 ( module )。 


eo 










































































12. 2 模块 和 文件 


























如 果 说 模块 是 按照 逻辑 来 组 织 Python 代码 的 方法 ， 那 么 文件 便 是 物理 层 上 组 织 模块 的 方法 。 
因此 ， 一 个 文件 被 看 作 是 一 个 独立 模块 ， 一 个 模块 也 可 以 被 看 作 是 一 个 文件 。 模块 的 文件 名 就 是 模 
块 的 名 字 加 上 扩展 名 .py 。 这 里 我 们 需要 讨论 一 些 关 于 模块 文件 结构 的 问题 。 与 其 它 可 以 导入 类 
(class) 的 语言 不 同 , 在 Python 中 你 导入 的 是 模块 或 模块 属性 。 
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12. 2. 1 模块 名 称 空间 
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本 章 的 后 面 会 详细 的 讨论 名 称 空间 ， 但 从 基本 概念 来 说 ， 一 个 名 称 空间 就 是 一 个 从 名 称 到 对 象 
的 关系 映射 集合 。 我 们 已 经 明确 地 知道 ， 模 块 名 称 是 它们 的 属性 名 称 中 的 一 个 重要 部 分 。 例如 
string 模块 中 的 atoiO 函数 就 是 string.atoiO 。 给 定 一 个 模块 名 之 后 ， 只 可 能 有 一 个 模块 被 
导入 到 Python 解释 器 中 ， 所 以 在 不 同 模块 间 不 会 出 现 名 称 交 叉 现 象 ; 所 以 每 个 模块 都 定义 了 它 自 
己 的 唯一 的 名 称 空 间 。 如 果 我 在 我 自己 的 模块 mymodule 里 创建 了 一 个 atoiO 函数 ， 那 么 它 的 名 
字 应 该 是 mymodule.atoiO 。 所 以 即使 属性 之 间 有 名 称 冲 突 ， 但 它们 的 完整 授权 名 称 (fully 
qualified name) 一 一 通过 句点 属性 标识 指定 了 各 自 的 名 称 空间 - 防止 了 名 称 冲 突 的 发 生 。 





























12. 2. 2 搜索 路 径 和 路 径 搜 索 





模块 的 导入 需要 一 个 叫做 路径 搜索 ”的 过 程 。 即 在 文件 系统 ”预定 义 区 域 “ 中 查找 mymodule. py 
文件 (如 果 你 导入 mymodule 的 话 )。 这 些 预 定义 区 域 只 不 过 是 你 的 Python 搜索 路 径 的 集合 。 路 径 
搜索 和 搜索 路 径 是 两 个 不 同 的 概念 ， 前 者 是 指 查 找 茶 个 文件 的 操作 ， 后 者 是 去 查找 一 组 目录 。 有 时 
候 导 入 模块 操作 会 失败 : 














222 Import xxx 
Traceback (innermost last): 
File interactive input)’, line l, in ? 








Importkrror: No module named xxx E 
发 生 这 样 的 错误 时 ， 解 释 器 会 告诉 你 它 无 法 访问 请 求 的 模块 ， 可 能 的 原因 是 模块 不 在 搜索 路 
径 里 ， 从 而 导致 了 路 径 搜索 的 失败 。 
默认 搜索 路 径 是 在 编译 或 是 安装 时 指定 的 。 它 可 以 在 一 个 或 两 个 地 方 修 改 。 
一 个 是 启动 Python 的 shell 或 命令 行 的 PYTHONPATH 环境 变量 。 该 变量 的 内 容 是 一 组 用 冒 
号 分 割 的 目录 路 径 。 如 果 你 想 让 解释 器 使 用 这 个 变量 ， 那 么 请 确保 在 启动 解释 器 或 执行 Python 脚 
本 前 设置 或 修改 了 该 变量 。 
解释 器 启动 之 后 ， 也 可 以 访问 这 个 搜索 路 径 ， 它 会 被 保存 在 sys 模块 的 sys.path 变量 里 。 
不 过 它 已 经 不 是 冒号 分 割 的 字符 串 ， 而 是 包含 每 个 独立 路 径 的 列表 。 下 面 是 一 个 Unix 机 器 搜索 路 
径 的 样 例 。 切 记 ， 搜 索 路 径 在 不 同系 统 下 一 般 是 不 同 的 。 





























222 sys. path 

rv '/usr/local/lib/pythonZ. x/’, '/usr/local/lib/ | pythonZ x/plat-sunos5’, 
'/usr/local/lib/pythonZ. x/ lib-tk', '/usr/local/lib/pythonZ. x/lib-dynload', ° 
usr/local/lib/Python2. x/site-packages', J 





这 只 是 个 列表 ， 所 以 我 们 可 以 随时 随地 对 它 进行 修改 。 如 果 你 知道 你 需要 导入 的 模块 是 什么 ， 
而 它 的 路 径 不 在 搜索 路 径 里 ， 那 么 只 需要 调用 列表 的 appendO 方法 即 可 ， 就 像 这 样 : 








sys. path. append l /home/wesc/py/1ib') 
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修改 完成 后 ， 你 就 可 以 加 载 自 己 的 模块 了 。 只 要 这 个 列表 中 的 茶 个 目录 包含 这 个 文件 ， 它 就 会 
被 正确 导入 。 当然 ， 这 个 方法 是 把 目录 追加 在 搜索 路 径 的 尾部 。 如 果 你 有 特殊 需要 ， 那 么 应 该 使 
用 列表 的 insertO 方法 操作 。 上 面 的 例子 里 ， 我 们 是 在 交互 模式 下 修改 sys.path 的 ， 在 脚本 
程序 中 也 完全 可 以 达到 同样 的 目的 。 这 里 是 使 用 交互 模式 执行 时 遇 到 的 错误 : 





























222 import sys 
222 import mymodule 
Traceback (innermost last): File “<stdin>”, line l, in ? 
ImportError: No module named mymodule 
P2» 
222 sys. path. append C /home/wesc/py/1ib’ ) 
222 sys. path 
C’, '/usr/local/lib/pythonZ. xf, '/usr/local/lib/ 
python2. x/plat-sunos5’, '/usr/local/lib/pythonZ. x/ 
lib-tk', '/usr/local/lib/pythonZ. x/lib-dynload’, '/usr/ 
local/lib/pythonZ. x/site-packages' , '/home/wesc/py/l1ib'] 
P» 

22^ import mymodule 





fer 

从 另 一 方面 看 ， 你 可 能 有 一 个 模块 的 很 多 拷贝 。 这 时 ， 解 释 器 会 使 用 沿 搜索 路 径 顺序 找 到 的 
第 一 个 模块 。 

使 用 sys. modules 可 以 找到 当前 导入 了 哪些 模块 和 它们 来 自 什么 地 方 。 和 sys. path 不 同 ， 
sys. modules 是 一 个 字典 ， 使 用 模块 名 作为 键 〈 key) ， 对 应 物理 地 址 作为 值 ( value )。 




















12.3 名 称 空 间 


名 称 空间 是 名 称 (标识 符 ) 到 对 象 的 映射 。 向 名 称 空间 添加 名 称 的 操作 过 程 涉 及 到 绑 定 标识 符 到 
指定 对 象 的 操作 (以 及 给 该 对 象 的 引用 计数 加 1 ) 。《Python 语言 参考 》X(Python Language Reference? 
有 如 下 的 定义 : 改变 一 个 名 字 的 绑 定 叫做 重新 绑 定 ， 删 除 一 个 名 字 叫 做 解除 绑 定 。 

我 们 在 第 11 章 已 经 介绍 过 在 执行 期 间 有 两 个 或 三 个 活动 的 名 称 空间 。 这 三 个 名 称 空间 分 别 是 
局 部 名 称 空间 ， 全 局 名 称 空间 和 内 建 名 称 空间 ， 但 局 部 名 称 空间 在 执行 期 间 是 不 断 变化 的 ， 所 以 我 
们 说 “两 个 或 三 个 “。 从 名 称 空间 中 访问 这 些 名 字 依 赖 于 它们 的 加 载 顺序 ， 或 是 系统 加 载 这 些 名 称 空 
间 的 顺序 。 

Python 解释 器 首先 加 载 内 建 名 称 空间 。 它 由 builtins ”模块 中 的 名 字 构 成 。 随后 加 载 执 



































行 模块 的 全 局 名 称 空间 ， 它 会 在 模块 开始 执行 后 变 为 活动 名 称 空间 。 这 样 我 们 就 有 了 两 个 活动 的 名 


称 空间 。 
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核心 笔记 : builtins 和  builtin - 

. builtins 模块 和 _ builtin 模块 不 能 混淆 。 虽然 它们 的 名 字 相 似 一 一 尤其 对 于 新 手 来 
bi. ^ builtins ”模块 包含 内 建 名 称 空间 中 内 建 名 字 的 集合 。 其 中 大 多 数 (如果 不 是 全 部 的 话 ) 来 
E builtin 模块 ， 该 模块 包含 内 建 函 数 ， 异 常 以 及 其 他 属性 。 在 标准 Python 执行 环境 下 ， 
builtins 包含 _builtin 的 所 有 名 字 。 Python 曾经 有 一 个 限制 执行 模式 ， 人 允许 你 修改 
. builtins ， 只 保留 来 自 _ builtin ”的 一 部 分 ， 创 建 一 个 沙 盒 〈sandbox) 环境 。 但 是 ， 因 为 
它 有 一 定 的 安全 缺陷 ， 而 且 修 复 它 很 困难 ，Python 已 经 不 再 支持 限制 执行 模式 。 (如 版 本 2.3 ) 





AP 


如 果 在 执行 期 间 调 用 了 一 个 函数 ， 那 么 将 创建 出 第 三 个 名 称 空间 ， 即 局 部 名 称 空 间 。 我 们 可 以 
通过 globals) 和 locals) 内 建 函 数 判断 出 某 一 名 字 属 于 哪个 名 称 空间 。 我 们 将 在 本 章 后 面 详细 
介绍 这 两 个 函数 。 














12.3.1 ”名 称 空间 与 变量 作用 域 比较 


好 了 ， 我 们 已 经 知道 了 什么 是 名 称 空间 ， 那 么 它 与 变量 作用 域 有 什么 关系 呢 ? 它 们 看 起 来 极其 
相似 。 事实 上 也 确实 如 此 。 

















名 称 空间 是 纯粹 意义 上 的 名 字 和 对 象 间 的 映射 关系 ， 而 作用 域 还 指出 了 从 用 户 代码 的 哪些 物 
里 位 置 可 以 访问 到 这 些 名 字 。 12 - 1 展示 了 名 称 空 间 和 变量 作用 域 的 关系 。 




















vH 














注意 每 个 名 称 空间 是 一 个 自我 包含 的 单元 。 但 从 作用 域 的 观点 来 看 ， 事 情 是 不 同 的 ， 所 有 局 部 
名 称 空间 的 名 称 都 在 局 部 作用 范围 内 。 局 部 作用 范围 以 外 的 所 有 名 称 都 在 全 局 作用 范围 内 。 




















还 要 记得 在 程序 执行 过 程 中 ， 局 部 名 称 空间 和 作用 域 会 随 函 数 调 用 而 不 断 变 化 ， 而 全 局 名 称 空 
间 是 不 变 的 。 
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学 完 这 一 节 后 ， 我 们 建议 读者 在 遇 到 名 称 空间 的 时 候 想 想 " 它 存在 吗 ?“， 遇 到 变量 作用 域 的 时 
H^ 能 看 见 它 吗 ?” 
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12.3.2 名 称 查 找 ， 确 定 作 用 域 ， 履 盖 

















那么 确定 作用 域 的 规则 是 如 何 联系 到 名 称 空间 的 呢 ? 它 所 要 做 的 就 是 名 称 查 询 ， 访 问 一 个 属性 
时 ， 解 释 器 必须 在 三 个 名 称 空间 中 的 一 个 找到 它 。 首先 从 局 部 名 称 空间 开始 ， 如 果 没 有 找到 ， 解 释 
器 将 继续 查找 全 局 名 称 空间 ， 如 果 这 也 失败 了 ， 它 将 在 内 建 名 称 空间 里 查找 。 如 果 最 后 的 尝试 也 失 
败 了 ， 你 会 得 到 这 样 的 错误 : 











>>> foo 
Traceback (innermost last): File ^Xstdim^^, line 1, in ? 


NameError: foo 


XX ME ASL AG BE RS n e E i RE SE ts ER AY TAN. 这 体现 了 名 称 
履 盖 的 影响 。 12 - 1 Mix EF ERAO. 例如 ， 局 部 名 称 空间 中 找到 的 名 字 会 隐藏 全 
局 或 内 建 名 称 空间 的 对 应 对 象 。 这 就 相当 于 “ 禾 盖 “了 那个 全 局 变量 。 请 参阅 前 面 章节 引入 的 这 几 
行 代码 : 
def foo(): 
print ^|ncalling foo... ^ 


bar = 200 
print “in foo(), bar is’, bar 
bar = 100 


print “in main , bar is’, bar 
foo () 
执行 代码 ， 我 们 将 得 到 这 样 的 输出 : 











in main , bar is 100 
calling foo()... 
in foo(), bar is 200 


foo) 函数 局 部 名 称 空间 里 的 bar 变量 覆盖 了 全 局 的 bar 变量 。 虽然 bar 存在 于 全 局 名 称 
空间 里 ， 但 程序 首先 找到 的 是 局 部 名 称 空间 里 的 那个 ， 所 以 “覆盖 “了 全 局 的 那个 。 关于 作用 域 的 更 
多 内 容 请 参阅 第 11.8 W. 





12.3.3 无 限制 的 名 称 空间 








Python 的 一 个 有 用 的 特性 在 于 你 可 以 在 任何 需要 放置 数据 的 地 方 获得 一 个 名 称 空间 。 我 们 已 
经 在 前 一 章 见 到 了 这 一 特性 ， 你 可 以 在 任何 时 候 给 函数 添加 属性 (使 用 熟悉 的 句点 属性 标识 ) o 
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def foo(): 
pass 
foo. doc = 'Üops, forgot to add doc str above!’ 


foo. version = 0.2 





在 本 章 ， 我 们 展示 了 模块 是 如 何 创建 名 称 空间 的 ， 你 也 可 以 使 用 相同 的 方法 访问 它们 : 


mymodule. foo () 
mymodule. version 


虽然 我 们 还 没 介 绍 面向 对 象 编程 (00P， 第 13 章 )， 但 我 们 可 以 看 看 一 个 简单 的 “Hello 
World!” i+: 


class MyUItimatePythonStorageDevice (object): 
pass 
bag = MyUItimatePythonStorageDevice () 
bag. x = 100 
bag. y = 200 
bag. version = 0. 1 
bag. completed = False 











你 可 以 把 任何 想 要 的 东西 放 入 一 个 名 称 空间 里 。 像 这 样 使 用 一 个 类 (实例 ) 是 很 好 的 ， 你 甚至 
不 需要 知道 一 些 关 于 00P 的 知识 (注解 : 类 似 这 样 的 变量 叫做 实例 属性 。) 不 管 名 字 如 何 ， 这 个 实 
例 只 是 被 用 做 一 个 名 称 空间 。 























随 着 学 习 的 深入 ， 你 会 发 现 00P 是 多 么 地 有 用 ， 比 如 在 运行 时 临时 (而 且 重 要 ) 变 量 的 时 候 ! 
正如 在 《Python Z1) (Zen of Python) 中 陈述 的 最 后 一 条 ,“ 名 字 空 间 是 一 个 响亮 的 杰出 创意 一 一 
那 就 让 我 们 多 用 用 它们 吧 !“ (在 交互 模式 解释 器 下 导入 this 模块 就 可 以 看 到 完整 的 (Zen) ) 。 











12.4 导入 模块 


12. 4. 1 语句 
使 用 import 语句 导入 模块 ， 它 的 语法 如 下 所 示 : 


import modulel 
import module2[ 


import moduleN 





|e— 一 * 一 
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也 可 以 在 一 行内 导入 多 个 模块 ， 像 这 样 


import modulel[, module2[,... moduleN] ] 








但 是 这 样 的 代码 可 读 性 不 如 多 行 的 导入 语句 。 而 且 在 性 能 上 和 生成 Python 字 节 代码 时 这 两 种 
做 法 没有 什么 不 同 。 所 以 一 般 情况 下 ， 我 们 使 用 第 一 种 格式 。 








核心 风格 : import 语句 的 模块 顺序 

我 们 推荐 所 有 的 模块 在 Python 模块 的 开头 部 分 导入 。 而 且 最 好 按照 这 样 的 顺序 : 

€ Python 标准 库 模 块 

@ Python 第 三 方 模块 

e 应 用 程序 自 定义 模块 

然后 使 用 一 个 空 行 分 割 这 三 类 模块 的 导入 语句 。 这 将 确保 模块 使 用 固定 的 习惯 导入 ， 有 助 于 减 
少 每 个 模块 需要 的 import 语句 数目 。 其 他 的 提示 请 参考 《 Python 风格 指南 》(Python”s Style 
Guide) , PEP8 . 





解释 器 执行 到 这 条 语句 ， 如 果 在 搜索 路 径 中 找到 了 指定 的 模块 ， 就 会 加 载 它 。 该 过 程 遵循 作用 
域 原则 ， 如 果 在 一 个 模块 的 顶层 导入 ， 那 么 它 的 作用 域 就 是 全 局 的 ;， 如 果 在 函数 中 导入 ， 那 么 它 的 
作用 域 是 局 部 的 。 








如 果 模 块 是 被 第 一 次 导入 ， 它 将 被 加 载 并 执行 。 E 
12.4.2 from-import 语句 


你 可 以 在 你 的 模块 里 导入 指定 的 模块 属性 。 也 就 是 把 指定 名 称 导入 到 当前 作用 域 。 使 用 
from-import 语句 可 以 实现 我 们 的 目的 ， 它 的 语法 是 : 











from module import namel[, name2[,... nameN]] 


12.4.3 BATRA 


多 行 导 入 特性 是 Python 2.4 为 较 长 的 from-import 提供 的 。 从 一 个 模块 导入 许多 属性 时 ， 
import 行 会 越 来 越 长 ， 直 到 自动 换行 ， 而 且 需 要 一 个 \、。 下 面 是 PEP 328 提供 的 样 例 代码 : 





























from Tkinter import Tk, Frame, Button, Entry, Canvas, \ 
Text, LEFT, DISABLED, NORMAL, RIDGE, END 


你 可 以 选择 使 用 多 行 的 from-import 语句 : 
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from Tkinter import Tk, Frame, Button, Entry, Canvas, Text 
from Tkinter import LEFT, DISABLED, NORMAL, RIDGE, END 





我 们 不 提倡 使 用 不 再 流行 的 fromTkinter import * 语句 (参考 第 12.5.3 — WI Eo Xs). 
真正 的 Python 程序 员 应 该 使 用 Python 的 标准 分 组 机 制 ( 圆 括号 ) 来 创建 更 合理 的 多 行 导入 语句 : 

















你 可 以 在 PEP 328 找到 更 多 关于 多 行 导 入 的 内 容 。 
12. 4. 4 扩展 的 import 语句 (as) 
有 时 候 你 导入 的 模块 或 是 模块 属性 名 称 已 经 在 你 的 程序 中 使 用 了 ， 或 者 你 不 想 使 用 导入 的 名 字 。 


可 能 是 它 太 长 不 便 输入 什么 的 ， 总 之 你 不 喜欢 它 。 这 已 经 成 为 Python 程序 员 的 一 个 普遍 需求 : 使 
用 自己 想 要 的 名 字 蔡 换 模 块 的 原始 名 称 。 一 个 普 过 的 解决 方案 是 把 模块 赋值 给 一 个 变量 : 























22^ import longmodulename 
225 short = longmodulename 
22» del longmodulename 




















1 上 边 的 例子 中 ， 我 们 没有 使 用 longmodulename.attribute ， 而 是 使 用 short.attribute 来 
T 访问 相同 的 对 象 。 〈 from-imoort 语句 也 可 以 解决 类 似 的 问题 ， 参 见 下 面 的 例子 。) 不 过 在 程序 
里 一 裔 又 一 遍 做 这 样 的 操作 是 很 无 聊 的 。 使 用 扩展 的 import ， 你 就 可 以 在 导入 的 同时 指定 局 部 

绑 定 名 称 。 类 似 这 样 ... 


import Tkinter 
from cgi import FieldStorage 
.可 以 替换 为 . . . 
import Tkinter as tk 
from cgi import FieldStorage as form 





Python 2.0 加 入 了 这 个 特性 。 不 过 那 时 “as” 还 不 是 一 个 关键 字 ; Python 2.6 正式 把 它 列 为 
一 个 关键 字 。 更 多 关于 扩展 导入 语句 的 内 容 请 参阅 《 Python 语言 参考 》 和 PEP 221. 








12.5 模块 导入 的 特性 
12.5.1 载 入 时 执行 模块 


加 载 模块 会 导致 这 个 模块 被 "执行 ”。 也 就 是 被 导入 模块 的 顶层 代码 将 直接 被 执行 。 这 通常 包 
括 设 定 全 局 变量 以 及 类 和 函数 的 声明 。 如 果 有 检查 name ”的 操作 ， 那 么 它 也 会 被 执行 。 
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当然 ， 这 样 的 执行 可 能 不 是 我 们 想 要 的 结果 。 你 应 该 把 尽 可 能 多 的 代码 封装 到 函数 。 明 确 地 说 ， 
只 把 函数 和 模块 定义 放 入 模块 的 顶层 是 恨 好 的 模块 编程 习惯 。 




















更 多 信息 请 参阅 第 14.1.1 节 以 及 相应 的 “核心 笔记 ”。 


Python 加 入 的 一 个 新 特性 允许 你 把 一 个 已 经 安装 的 模块 作为 脚本 执行 。 (当然 ， 执 行 你 自己 的 
脚本 很 简单 [$ foo. py]， 但 执行 一 个 标准 库 或 是 第 三 方 包 中 的 模块 需要 一 定 的 技巧 。) 你 可 以 在 第 
14.4.3 一 节 了 解 更 多 。 








12.5.2 导入 (import ) MİN (load) 


一 个 模块 只 被 加 载 一 次 ， 无 论 它 被 导入 多 少 次 。 这 可 以 阻止 多 重 导 入 时 代码 被 多 次 执行 。 例 
如 你 的 模块 导入 了 sys 模块 ， 而 你 要 导入 的 其 他 5 个 模块 也 导入 了 它 ， 那 么 每 次 都 加 载 sys (或 
是 其 他 模块 ) 不 是 明智 之 举 ! 所 以 ， 加 载 只 在 第 一 次 导入 时 发 生 。 








12.5.3 ”导入 到 当前 名 称 空间 的 名 称 











调用 from-import 可 以 把 名 字 导 入 当前 的 名 称 空间 里 去 ， 这 意味 着 你 不 需要 使 用 属性 /句点 E 
属性 标识 来 访问 模块 的 标识 符 。 例如 ， 你 需要 访问 模块 module 中 的 var 名 字 是 这 样 被 导入 的 : 

from module import var 

我 们 使 用 单个 的 var 就 可 以 访问 它 自 身 。 把 var 导入 到 名 称 空间 后 就 再 没 必要 引用 模块 了 。 
当然 ， 你 也 可 以 把 指定 模块 的 所 有 名 称 导 入 到 当前 名 称 空 间 里 : 


from module import * 




















核心 风格 : 限制 使 用 “from module import *^ 

在 实践 中 ， 我 们 认为 “from module import *” 不 是 良好 的 编程 风格 ， 因 为 它 “ 污 染 当前 名 称 
空间 ， 而 且 很 可 能 覆盖 当前 名 称 空间 中 现 有 的 名 字 ; 但 如 果菜 个 模块 有 很 多 要 经 常 访问 的 变量 或 者 
模块 的 名 字 很 长 ， 这 也 不 失 为 一 个 方便 的 好 办 法 。 

我 们 只 在 两 种 场合 下 建议 使 用 这 样 的 方法 ， 一 个 场合 是 : 目标 模块 中 的 属性 非常 多 ， 反 复 键 入 
模块 名 很 不 方便 ， 例 如 Tkinter (Python/Tk) 和 NumPy (Numeric Python) 模块 ， 可 能 还 有 
socket 模块 。 另 一 个 场合 是 在 交互 解释 器 下 ， 因 为 这 样 可 以 减少 输入 次 数 。 


12.5.4 ”被 导入 到 导入 者 作用 域 的 名 字 








只 从 模块 导入 名 字 的 另 一 个 副作用 是 那些 名 字 会 成 为 局 部 名 称 空间 的 一 部 分 。 这 可 能 导致 覆盖 
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一 个 已 经 存在 的 共有 相同 名 字 的 对 象 。 而 且 对 这 些 变量 的 改变 





T 


响 它 的 局 部 拷贝 而 不 是 所 导入 模 





Bi 
HE 








块 的 原始 名 称 空间 。 也 就 是 说 ， 绑 定 只 是 局 部 的 而 不 是 整个 名 称 空间 。 
这 里 我 们 提供 了 两 个 模块 的 代码 : 一 个 导入 者 ，impter. py ， 一 个 被 导入 者 ，imptee.py o 





impter.py 使 用 from-import 语句 只 创建 了 局 部 绑 
HHA RAHA 
# imptee. py # 
HHA RAHA 
foo = ‘abc’ 
def show(): 
print 'foo from imptee:', foo 
NGNNNNNNNNNNNN 
# impter. py # 
NNNNNNNNNNNNN 
from imptee import foo, 
show () 
foo = 123 
print 'foo from impter:’, 
show () 


show 


foo 


c 
Co 





运行 这 个 导入 者 程序 ， 我 们 发 现 从 被 导入 者 的 观点 看 ， 它 的 foo 变量 没有 改变 ， 即 使 我 们 


importer. py 里 修改 了 它 。 
foo from imptee: abc 
foo from impter: 123 
foo from imptee: abc 


唯一 的 解决 办 法 是 使 用 import 和 完整 的 标识 符 


VIERTE 

# impter. py # 

HHA RHA 

import imptee 

imptee. show () 

imptee. foo = 123 

print 'foo from impter:', imptee. foo 


imptee. show () 





完成 相应 修改 后 ， 结 果 如 我 们 所 料 : 


foo from imptee: abc 


bs 


, 一 | 


foo from impter: 123 
foo from imptee: 123 





|[e— 














ABR (句点 属性 标识 ) 。 
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12.5.5 XT future 





回首 Python 2.0 ， 我 们 认识 到 了 由 于 改进 ， 新 特性 ， 以 及 当前 特性 增强 ， 某 些 变化 会 影响 到 
当前 功能 。 所 以 为 了 让 Python 程序 员 为 新 事物 做 好 准备 ，Python 实现 了 _ future fat. 








使 用 from-import 语句 ”导入 “新 特性 ， 用 户 可 以 尝试 一 下 新 特性 或 特性 变化 ， 以 便 在 特性 固 
定 下 来 的 时 候 修 改 程序 。 它 的 语法 是 : 


from future import new feature 





只 import future ”不 会 有 任何 变化 ， 所 以 这 是 被 禁止 的 。 (事实 上 这 是 允许 的 ， 但 它 不 会 
如 你 所 想 的 那样 启用 所 有 特性 。) 你 必须 显示 地 导入 指定 特性 。 你 可 以 在 PEP 236 找到 更 多 关于 
future ”的 资料 。 








12.5.6 警告 框架 








和 future ”指令 类 似 ， 有 必要 去 警告 用 户 不 要 使 用 一 个 即将 改变 或 不 支持 的 操作 ， 这 样 他 
们 会 在 新 功能 正式 发 布 前 采取 必要 措施 。 这 个 特性 是 很 值得 讨论 的 ， 我 们 这 里 分 步 讲解 一 下 。 





首先 是 应 用 程序 ( 员 ) 接 口 (Application programmers’ interface , API). 程序 员 应 该 有 从 
Python 程序 (通过 调用 warnings 模块 ) 或 是 C 中 (通过 PyErr Warn OO? 调用 ) 发 布 警告 的 能 

这 个 框架 的 另 个 部 分 是 一 些 警 告 异常 类 的 集合 。 Warning 直接 从 Exception 继承 ， 作 为 所 有 
警告 的 基 类 : UserWarning , DeprecationWarning , SyntaxWarning ， 以 及 RuntimeWarning . 都 
在 第 10 章 中 有 详细 介绍 。 














另 一 个 组 件 是 警告 过 滤器 ， 由 于 过 滤 有 多 种 级 别 和 严重 性 ， 所 以 警告 的 数量 和 类 型 应 该 是 可 控 
制 的 。 警告 过 滤器 不 仅仅 收集 关于 警告 的 信息 (例如 行 号 ， 人 警告 原因 等 等 )， 而 且 还 控制 是 否 忽略 警 
告 ， 是 否 显 示 一 一 自 定义 的 格式 一 一 或 者 转换 为 错误 (生成 一 个 异常 ) 。 
































警告 会 有 一 个 默认 的 输出 显示 到 sys.stderr ， 不 过 有 钩子 可 以 改变 这 个 行为 ， 例如 ， 当 运行 
会 引发 警告 的 Python 脚本 时 , 可 以 记录 它 的 输出 记录 到 日 志文 件 中 , 而 不 是 直接 显示 给 终端 用 户 。 
Python 还 提供 了 一 个 可 以 操作 警告 过 滤器 的 API 。 


























最 后 ， 命 令 行 也 可 以 控制 警告 过 滤器 。 你 可 以 在 局 动 Python 解释 器 的 时 候 使 用 -W 选项 。 请 
参阅 PEP 230 的 文档 获得 你 的 Python 版 本 的 对 应 开关 选项 。 Python 2.1 第 一 次 引入 警告 框架 。 





12.5.7  J ZIP 文件 中 导入 模块 














Edit By Vheavens 


Edit By Vheavens 


ee 
T 


在 2.3 fie, Python 加 入 了 从 ZIP 归档 文件 导入 模块 的 功能 。 如 果 你 的 搜索 路 径 中 存在 一 
个 包含 Python 模块 (.py，.pyc，or .pyo 文件 ) 的 .zip 文件 ， 导 入 时 会 把 ZIP 文件 当 作 目录 处 
理 ， 在 文件 中 搜索 模块 。 











如 果 要 导入 的 一 个 ZIP 文件 只 包含 .py X, MWA Python 不 会 为 其 添加 对 应 的 .pyc 文件 ， 
这 意味 着 如 果 一 个 ZIP 归档 没有 匹配 的 . pyc 文件 时 ， 导 入 速度 会 相对 慢 一 点 。 














同时 你 也 可 以 为 .zip 文件 加 入 特定 的 CE) 目录 ， 例 如 /tmp/yolk.zip/lib 只 会 从 yolk JA 
档 的 lib/ 子 目 录 下 导入 。 虽然 PEP 273 指定 了 这 个 特性 ， 但 事实 上 使 用 了 PEP 302 提供 的 导入 
钩子 来 实现 它 。 








12.5.8 “新 的 “导入 钩子 


导入 ZIP 归档 文件 这 一 特性 其 实 新 导入 钩子 ( import hook , PEP 302) 的 “第 一 个 顾客 ^。 我 
们 使 用 了 “新 “这 个 字 ， 因 为 在 这 之 前 实现 自 定义 导入 器 只 能 是 使 用 一 些 很 古老 的 模块 ， 它 们 并 不 会 
简化 创建 导入 器 。 另 一 个 解决 方法 是 覆盖 import 0 ， 但 这 并 不 简单 ， 你 需要 (重新 ) 实现 整个 
导入 机 制 。 

Python 2.3 引入 的 新 导入 钓 子 , 从 而 简化 了 这 个 操作 。 你 只 需要 编写 可 调用 的 import 类 ， 然 


后 通过 sys 模块 “注册 ” Gump RU. 
你 需要 两 个 类 : 一 个 查找 器 和 一 个 载 入 器 。 这 些 类 的 实例 接受 一 个 参数 : 模块 或 包 的 全 名 称 。 


查找 器 实例 负责 查找 你 的 模块 ， 如 果 它 找到 ， 那 么 它 将 返回 一 个 载 入 器 对 象 。 查 找 器 可 以 接受 一 个 
路 径 用 以 查找 子 包 (subpackages) 。 载 入 器 会 把 模块 载 入 到 内 存 。 它 负责 完成 创建 一 个 Python Ti 
块 所 需要 的 一 切 操作 ， 然 后 返回 模块 。 












































这 些 实例 被 加 入 到 sys.path hooks 。 sys. path importer cache 只 是 用 来 保存 这 些 实例 ， 这 
样 就 只 需要 访问 path hooks 一 次 。 最 后 ，sys. meta_path 用 来 保存 一 列 需 要 在 查询 sys. path 之 
前 访问 的 实例 ， 这 些 是 为 那些 已 经 知道 位 置 而 不 需要 查找 的 模块 准备 的 。 meta-path 已 经 有 了 指 
定 模块 或 包 的 载 入 器 对 象 的 读 取 器 。 














12.6 模块 内 建 函数 
系统 还 为 模块 提供 了 一 些 功能 上 的 支持 ， 现 在 我 们 将 详细 讨论 他 们 . 


12.6.1 import (Q) 





Python 1.5 加 入 了 import () 函数 ， 它 作为 实际 上 导入 模块 的 函数 ， 这 意味 着 import 语 
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名 调用 import (O 函数 完成 它 的 工作 。 提 供 这 个 函数 是 为 了 让 有 特殊 需要 的 用 户 覆 盖 它 ， 实 现 
自 定义 的 导入 算法 。 




















_ import () 的 语法 是 : 
. import (module name[, globals[, Jocals/, fromlist/]/]) 














module name 变量 是 要 导入 模块 的 名 称 ，globals 是 包含 当前 全 局 符号 表 的 名 字 的 字典 ， 
locals 是 包含 局 部 符号 表 的 名 字 的 字典 ， fromlist 是 一 个 使 用 from-import 语句 所 导入 符号 的 
列表 。 

globals , locals ， 以 及 fromlist 参数 都 是 可 选 的 ， 默 认 分 别 为 globalsO , localsO 和 
[] à 

调用 import sys 语句 可 以 使 用 下 边 的 语句 完成 : 

sys = import (sys') 











12. 6.2 globals) 和 locals () 





globals) 和 locals 内 建 函数 分 别 返 回调 用 者 全 局 和 局 部 名 称 空间 的 字典 。 在 一 个 函数 内 
部 ， 局 部 名 称 空间 代表 在 函数 执行 时 候 定 义 的 所 有 和 名字，1locals 0 函数 返回 的 就 是 包含 这 些 名 字 
的 字典 。 globals) 会 返回 函数 可 访问 的 全 局 名 字 。 











在 全 局 名 称 空间 下 ，globals() 和 locals 返回 相同 的 字典 ， 因 为 这 时 的 局 部 名 称 空间 就 是 
全 局 空间 。 下 边 这 段 代 码 演 示 这 两 个 函数 的 了 使 用 : 


def foo(): 

print '|ncalling foo..." 

aString = 'bar' 

anint = 42 

print “fooQ)’s globals:^ globals(). keys 

print /(foo()'s locals:^ locals (.keys 
print ~ main 's globals:^ globals(). keys() 
print /^ main 's locals:^, locals().keys() foo) 











我 们 只 在 这 里 访问 了 字典 的 键 ， 因 为 它 的 值 在 这 里 没有 影响 (而 且 他 们 会 让 行 变 得 更 长 更 难 
TE) 。 
执行 这 个 脚本 ， 我 们 得 到 如 下 的 输出 : 


$ namespaces. py 
. main 's globals: [(! doc ’, 'foo', ' name ^', ' builtins ”J/ 
. main 's locals: /” doc ^", 'foo', ' name ^", ' builtins ”J 








E 





$— 一 * 一 
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calling foo()... 
foo()'s globals: [' doc ', 'foo', ' name °, ' builtins '/ 
foo()"'s locals: l'anint/', 'aString J 








12.6.3 reloadQ) 





reload) 内 建 函 数 可 以 重新 导入 一 个 已 经 导入 的 模块 。 它 的 语法 如 下 : 
reload (module) 








module 是 你 想 要 重新 导入 的 模块 。 使 用 reloadO 的 时 候 有 一 些 标准 。 首先 模块 必须 是 全 部 
导入 (不 是 使 用 from-import)， 而 且 它 必须 被 成 功 导 入 。 另 外 reload() 函数 的 参数 必须 是 模块 自 
身 而 不 是 包含 模块 名 的 字符 串 。 也 就 是 说 必须 类 似 reload(sys) 而 不 是 reload( sys’). 


模块 中 的 代码 在 导入 时 被 执行 ， 但 只 执行 一 次 .以 后 执行 import 语句 不 会 再 次 执行 这 些 代 码 ， 
只 是 绑 定 模块 名 称 。 而 reloadO 函数 不 同 。 


12.7 包 














$ 包 是 一 个 有 层次 的 文件 目录 结构 ， 它 定义 了 一 个 由 模块 和 子 包 组 成 的 Python 应 用 程序 执行 
环境 。Python 1.5 加 入 了 包 ， 用 来 帮助 解决 如 下 问题 : 
e 为 平坦 的 名 称 空间 加 入 有 层次 的 组 织 结构 
e 人 允许 程序 员 把 有 联系 的 模块 组 合 到 一 起 
e 人 允许 分 发 者 使 用 目录 结构 而 不 是 一 大 堆 混 乱 的 文件 
e 帮助 解决 有 冲突 的 模块 名 称 

















与 类 和 模块 相同 ， 包 也 使 用 句点 属性 标识 来 访问 他 们 的 元 素 。 使 用 标准 的 import 和 
from-import 语句 导入 包 中 的 模块 。 


12.7. 1 目录 结构 








假定 我 们 的 包 的 例子 有 如 下 的 目录 结构 : 
Phone/ 
_ init .py 
common util. py 
Voicedta/ 
J init .py 
Pots. py 

















Edit By Vheavens 


Edit By Vheavens 


eo 





Isdn. py 
Fax/ 

__ init__.py 

G3. py 
Mobile/ 

_ init__.py 

Analog. py 

igital. py 
Pager/ 

| init .py 

Numeric. py 


Phone 是 最 顶层 的 包 ，Voicedta 等 是 它 的 子 包 。 我 们 可 以 这 样 导 入 子 包 : 
import Phone. Mobile. Analog 
Phone. Mobile. Analog. dial () 





你 也 可 使 用 from-import 实现 不 同 需求 的 导入 。 











第 一 种 方法 是 只 导入 顶层 的 子 包 ， 然 后 使 用 属性 /点 操作 符 向 下 引用 子 包 树 : 
from Phone import Mobile 
Mobile. Analog. dial ( 555-1212’ ) 





此 外 ， 我 们 可 以 还 引用 更 多 的 子 包 : 
from Phone. Mobile import Analog 


Analog. dial ( 555-1212” ) 





事实 上 ， 你 可 以 一 直 沿 子 包 的 树 状 结构 导入 : 
from Phone. Mobile. Analog import dial 
dial C 555-1212) 








在 我 们 上 边 的 目录 结构 中 ， 我 们 可 以 发 现 很 多 的 init .py 文件 。 这 些 是 初始 化 模块 ， 
from-import 语句 导入 子 包 时 需要 用 到 它 。 如 果 没 有 用 到 ， 他 们 可 以 是 空 文件 。 程序 员 经 常 忘 记 
为 它们 的 包 目 录 加 入 — init .py 文件 ， 所 以 从 Python 2.5 开始 ， 这 将 会 导致 一 个 


ImportWarning 信息 。 











不 过 ， 除 非 给 解释 器 传递 了 W 选项 ， 否 则 它 会 被 简单 地 忽略 。 





12.7.2 使 用 from-import 导入 包 





[e— 一 * 一 
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包 同 样 支持 from-import all 语句 : 
from package. module import * 


然而 ， 这 样 的 语句 会 导入 哪些 文件 取决 于 操作 系统 的 文件 系统 ， 所 以 我 们 在 _init .py 中 加 
A all 变量 .该 变量 包含 执行 这 样 的 语句 时 应 该 导入 的 模块 的 名 字 ， 它 由 一 个 模块 名 字符 串 
列表 组 成 . o 





12.7.3 绝对 导入 














包 的 使 用 越 来 越 广 泛 ， 很 多 情况 下 导入 子 包 会 导致 和 真正 的 标准 库 模块 发 生 ( 事 实 上 是 它们 的 
名 字 ) 冲突。 包 模 块 会 把 名 字 相 同 的 标准 库 模 块 隐 藏 掉 ， 因 为 它 首先 在 包 内 执行 相对 导入 ， 隐 藏 卸 
标准 库 模 块 。 











为 此 ， 所 有 的 导入 现在 都 被 认为 是 绝对 的 ， 也 就 是 说 这 些 名 字 必 须 通过 Python 路 径 
(sys. path 或 是 PYTHONPATH ) 来 访问 。 














这 个 决定 的 基本 原理 是 子 包 也 可 以 通过 sys.path 访问 ， 例 如 import Phone. Mobile. Analog . 
在 这 个 变化 之 前 ， 从 Mobile 子 包 内 模块 中 导入 Analog 是 合理 的 。 作 为 一 个 折 中 方案 , Python fà 
许 通 过 在 模块 或 包 名 称 前 置 句 点 实现 相对 导入 。 更 多 信息 请 参阅 第 12.7.4 节 。 

















从 Python 2.7 开始 ， 绝 对 导入 特性 将 成 为 默认 功能 。 〈 从 Python 2.5 开始 ， 你 可 以 从 
. future GA absolute import ， 体 验 这 个 功能 。) 你 可 以 参阅 PEP 328 了 解 更 多 相关 内 容 。 


12.7.4 相 对 导入 


如 前 所 述 ， 绝 对 导入 特性 限制 了 模块 作者 的 一 些 特权 。 失 去 了 import 语句 的 上 自由， 必须 有 新 
的 特性 来 满足 程序 员 的 需求 。 这 时 候 ， 我 们 有 了 相对 导入 。 相对 导入 特性 稍微 地 改变 了 import 语 
法 ， 让 程序 员 告 诉 导入 者 在 子 包 的 哪里 查找 某 个 模块 。 因 为 import 语句 总 是 绝对 导入 的 ， 所 以 相 
对 导入 只 应 用 于 from-import 语句 。 























语法 的 第 一 部 分 是 一 个 句点 ， 指 示 一 个 相对 的 导入 操作 。 之 后 的 其 他 附加 句点 代表 当前 from 
起 始 碍 找 位 置 后 的 一 个 级 别 。 


我 们 再 来 看 看 上 边 的 例子 。 在 Analog.Mobile.Digital ， 也 就 是 Digital. py 模块 中 ， 我 们 不 
能 简单 地 使 用 这 样 的 语法 。 下 边 的 代码 只 能 工作 在 旧版 本 的 Python 下 ， 在 新 的 版 本 中 它 会 导致 一 
个 警告 ， 或 者 干脆 不 能 工作 : 

import Analog 








from Analog import dial 
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这 是 绝对 导入 的 限制 造成 的 。 你 需要 在 使 用 绝对 导入 或 是 相对 导入 中 做 出 选择 。 下 边 是 一 些 可 
行 的 导入 方法 : 
from Phone. Mobile. Analog import dial 




















from . Analog import dial 
from ..common util import setup 
from .. Fax import G8. dial. 


从 2.5 hk 开始 ， 相 对 导入 被 加 入 到 了 Python > 在 Python 2.6 中 ， 在 模块 内 部 的 导入 如 
果 没 有 使 用 相对 导入 ， 那 么 会 显示 一 个 警告 信息 。 你 可 以 在 PEP 328 的 文档 中 获得 更 多 相关 信息 。 








12.8 模块 的 其 他 特性 
12.8.1 自动 载 入 的 模块 


当 Python 解释 器 在 标准 模式 下 局 动 时 ， 一 些 模块 会 被 解释 器 自动 导入 ， 用 于 系统 相关 操作 。 
唯一 一 个 影响 你 的 是 “builtin_ _ 模块 ， 它 会 正常 地 被 载 入 ， 这 和 _builtins _ 模块 相同 。 





sys. modules 变量 包含 一 个 由 当前 载 入 (完整 且 成 功 导 入 ) 到 解释 器 的 模块 组 成 的 字典 ， 模 块 
名 作为 键 ， 它 们 的 位 置 作为 值 。 






































例如 在 Windows 下 ，sys. modules 变量 包含 大 量 载 入 的 模块 ， 我 们 这 里 截 短 它 ， 只 提供 他 们 的 
模块 名 ， 通 过 调用 字典 的 keys () 方法 : 

222 import sys 

222 sys. modules. keys () 


[’os. path’, 'os', 'exceptions', ' main  ', 'ntpath, 











Pi 


'strop', ‘nt’, 'sys', ' builtin ', ‘site’, 
'signal', 'UserDict/, ‘string’, 'stat'/ 


Unix 下 载 入 的 模块 很 类 似 : 

25^ Import sys 

222^ sys. modules. keys () 

[’os. path’, 'os', 'readline', 'exceptions', 

^ main ^, 'posix , 'sys, ' builtin’, ‘site’, 


'signal', 'UserDict/, 'posixpath', 'stat'] 


12.8.2 阻止 属性 导入 


E 





$— 一 * 一 
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如 果 你 不 想 让 某 个 模块 属性 被 “from module import *^ GA , 那么 你 可 以 给 你 不 想 导入 的 属 
性 名 称 加 上 一 个 下 划 线 (_)。 不 过 如 果 你 导入 了 整个 模块 或 是 你 显 式 地 导入 某 个 属性 (例如 import 
foo. bar )， 这 个 隐藏 数据 的 方法 就 不 起 作用 了 。 


—- 








12.8.3 不 区 分 大 小 的 导入 


有 一 些 操作 系统 的 文件 系统 是 不 区 分 大 小 写 的 。 Python 2.1 Bi, Python 尝试 在 不 同 平台 下 导 
入 模块 时 候 “ 做 正确 的 事情 *， 但 随 着 MacOS X 和 Cygwin 平台 的 流行 ， 这 样 的 不 足 已 经 不 能 再 被 忽 
视 ， 而 需要 被 清除 。 


























在 Unix( 区 分 大 小 写 ) 和 Win32 (不 区 分 大 小 写 ) 下 ， 一 切 都 很 明了 ， 但 那些 新 的 不 区 分 大 小 写 
的 系统 不 会 被 加 入 区 分 大 小 写 的 特性 。 PEP 235 指定 了 这 个 特性 ， 尝 试 解决 这 个 问题 ， 并 避免 那些 
其 他 系统 上 “hack” 式 的 解决 方法 。 底线 就 是 为 了 让 不 区 分 大 小 写 的 导入 正常 工作 ， 必 须 指定 一 个 叫 
做 PYTHONCASEOK 的 环境 变量 。 Python 会 导入 第 一 个 匹配 模块 名 ( 使 用 不 区 分 大 小 写 的 习惯 ) 。 
否则 Python 会 执行 它 的 原生 区 分 大 小 写 的 模块 名 称 匹 配 ， 导 入 第 一 个 匹配 的 模块 。 














12. 8. 4 源 代码 编码 


$ 从 Python 2.3 F48, Python 的 模块 文件 开始 支持 除 7 位 ASCII 之 外 的 其 他 编码 。 当然 
ASCII 是 默认 的 ， 你 只 要 在 你 的 Python 模块 头 部 加 入 一 个 额外 的 编码 指示 说 明 就 可 以 让 导入 者 
使 用 指定 的 编码 解析 你 的 模块 ， 编 码 对 应 的 Unicode 字符 串 。 所 以 你 使 用 纯 ASCII 文本 编辑 器 的 
时 候 不 需要 担心 了 (不 需要 把 你 的 字符 串 放 入 “Unicode 标签 ”里 ) 。 
一 个 UTF-8 编码 的 文件 可 以 这 样 指示 : 
Z!/usr/bin/env python 
# —- coding: UTF-8 —*- 












































如 果 你 执行 或 导入 了 包含 非 ASCII HJ Unicode 字符 串 而 没有 在 文件 头 部 说 明 ， 那 么 你 会 在 
Python 2.3 得 到 一 个 DeprecationWarning ， 而 在 2.5 中 这 样 做 会 导致 语法 错误 。 你 可 以 在 PEP 
263 中 得 到 更 多 关于 源 文件 编码 的 相关 内 容 。 








12. 8.5 导入 循环 


实际 上 , 在 使 用 Python 时 ， 你 会 发 现 是 能 够 导入 循环 的 。 如 果 你 开发 了 大 型 的 Python TFE, 
那么 你 很 可 能 会 陷入 这 样 的 境地 。 








我 们 来 看 一 个 例子 。 假定 我 们 的 产品 有 一 个 很 复杂 的 命令 行 接口 ( command-line interface , 
CLI). 其 中 将 会 有 超过 一 百 万 的 命令 ， 结 果 你 就 有 了 一 个 “ 超 宛 余 处 理 器 ”(overly massive handler, 





























Edit By Vheavens 


Edit By Vheavens 


ee 
T 


OMH) 子 集 。 每 加 入 一 个 新 特性 ， 将 有 一 到 三 条 的 新 命令 加 入 ， 用 于 支持 新 的 特性 。 下 边 是 我 们 的 
omh4cli. py 脚本 : 
from cli4vof import cli4vof 








# command line interface utility function 
def cli util: 
pass 
# overly massive handlers for the command line interface 
def omh4cli(): 


cli4vof O 


omh4cli () 





假定 大 多 控制 器 都 要 用 到 这 里 的 (其 实 是 空 的 ) 工具 函数 。 命 令 行 接口 的 OMH 都 被 封装 在 
omh4cli O 函数 里 。 如 果 我 们 要 添加 一 个 新 的 命令 ， 那 么 它 会 被 调用 。 








现在 这 个 模块 不 断 地 增长 ， 一 些 聪 明 的 工程 师 会 决定 把 新 命令 放 入 到 隔离 的 模块 里 ， 在 原始 模 
块 中 只 提供 访问 新 东西 的 钩子 。 这 样 ， 管 理 代 码 会 变 得 更 简单 ， 如 果 在 新 加 入 内 容 中 发 现 了 bug ， 
那么 你 就 不 必 在 一 个 几 兆 的 Python 文件 里 搜索 。 



































在 我 们 的 例子 中 ， 有 一 个 兴奋 的 经 理 要 我 们 加 入 一 个 “非常 好 的 特性 ”。 我 们 将 创建 一 个 新 的 
cli4vof. py 脚本 ， 而 不 是 把 新 内 容 集 成 到 omh4cli.py 里 : 


import omh4cli 











# command-line interface for a very outstanding feature 
def cli4vof(): 
omh4cli. cli utilQ 





前 边 已 经 提 到 ， 工 具 函 数 是 每 个 命令 必须 的 ， 而 且 由 于 不 能 把 代码 从 主 控制 器 复制 出 来 ， 所 以 
我 们 导入 了 主 模块 ， 在 我 们 的 控制 器 中 添加 对 omh , omh4cliO 的 调用 。 








问题 在 于 主 控制 器 omh4cli 会 导入 我 们 的 cli4vof 模块 (获得 新 命令 的 函数 )， 而 clidvof 
也 会 导入 omh4cli 〈 用 于 获得 工具 函数 ) 。 模 块 导 入 会 失败 ， 这 是 因为 Python 尝试 导入 一 个 先前 没 
有 完全 导入 的 模块 : 

$ python omh4cli. py 





Traceback (most recent call last): 

File “omh4cli. py”, line 3, in ? from cli4vof import cli4vof 
File “/usr/prod/cli4vof. py”, line 8, in ? 

import omh4cli 

File “/usr/prod/omh4cli. py”, line 8, in ? 

from cli4vof import cli4vof 





$— 一 * 一 
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ImportError: cannot import name cli4vof 











注意 跟踪 返回 消息 中 显示 的 对 cli4vof 的 循环 导入 。 问题 在 于 要 想 调 用 工具 函数 ，cli4vof 必 
须 导 入 omh4cli . 如 果 它 不 需要 这 样 做 ， 那 么 omh4cli 将 会 成 功 导 入 cli4vof ， 程 序 正 常 执 行 。 
但 在 这 里 ，omh4cli 尝试 导入 cli4vof ， 而 cli4vof 也 试 着 导入 omh4cli 。 最 后 谁 也 不 会 完成 
导入 工作 ， 引 发 错误 。 这 只 是 一 个 导入 循环 的 例子 。 事实 上 实际 应 用 中 会 出 现 更 复杂 的 情况 。 











解决 这 个 问题 几乎 总 是 移 除 其 中 一 个 导入 语句 。 你 经 常会 在 模块 的 最 后 看 到 import 语句 。 作 
为 一 个 初学 者 ， 你 只 需要 试 着 习惯 它们 ， 如 果 你 以 前 遇 到 在 模块 底部 的 import 语句 , 现在 你 知道 是 
为 什么 了 . 。 在 我 们 的 例子 中 ， 我 们 不 能 把 import omh4cli 移 到 最 后 ， 因 为 调用 cli4vof 0 的 时 
候 omh4cliQ) 名 字 还 没有 被 载 入 。 

$ python omh4cli. py 

















Traceback (most recent call last): File “omh4cli. py”, line 8, in ? from cli4vof import 
cli4vof 

File “/usr/prod/cli4vof. py”, line 7, in? 

import omh4cli 

File “/usr/prod/omh4cli. py”, line 13, in ? 

omh4cli () 

File “/usr/prod/omh4cli. py”, line 11, in omh4cli cli4vof 0 

File “/usr/prod/cli4vof. py”, line 5, in cli4vof omh4cli.cli util 

NameError: global name ’omh4cli’ is not defined 


我 们 的 解决 方法 只 是 把 import 语句 移 到 clidvofO 函数 内 部 : 
def cli4vof(): 

import omh4cli 

omh4cli. cli util Ọ 


这 样 ， 从 omh4cli() 导入 cli4vofO 模块 会 顺利 完成 ， 在 omh4cliO 被 调用 之 前 它 会 被 正 
确 导 入 。 只 有 在 执行 到 clidvof.clidvofO 时 候 才 会 导入 omh4cli 模块 。 

















12. 8. 5 模块 执行 





有 很 多 方法 可 以 执行 一 个 Python 模块 : 通过 命令 行 或 shell , execfileO ， 模 块 导 入 ， 解 
释 器 的 -m 选项 ， 等 等 。 这 已 经 超出 了 本 章 的 范围 。 你 可 以 参考 第 14 章 “ 执 行 环境 "， 里 边 全 面 
地 介绍 了 这 些 特 性 。 


12. 9 相关 模块 





$— 一 * 一 
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下 边 这 些 模 块 可 能 是 你 在 处 理 Python 模块 导入 时 会 用 到 的 辅助 模块 。 在 这 之 中 ， 
modulefinder ，pkgutil ， 以 及 zipimport 是 Python 2.3 新 增 内 容 ，distutils 包 在 Python 2.0 
被 引入 。 

€ imp - 这 个 模块 提供 了 一 些 底层 的 导入 者 功能 。 

€ modulefinder - 该 模块 允许 你 查找 Python 脚本 所 使 用 的 所 有 模块 。 你 可 以 使 用 其 中 的 

ModuleFinder 类 或 是 把 它 作 为 一 个 脚本 执行 ， 提 供 你 要 分 析 的 ( 另 个 ) Python 模块 的 文件 
名 。 

€ pkgutil - 该 模块 提供 了 多 种 把 Python 包 打 包 为 一 个 ^ 包 “文件 分 发 的 方法 。 类 似 site 

模块 ， 它 使 用 *. pkg 文件 帮助 定义 包 的 路 径 ， 类 似 site 模块 使 用 的 *. pth 文件 。 

€ site - 和 * pth 文件 配合 使 用 ， 指 定 包 加 入 Python 路 径 的 顺序 ， 例 如 sys.path , 

PYTHONPATH 。 你 不 需要 显 式 地 导入 它 ， 因 为 Python 导入 时 默认 已 经 使 用 该 模块 。 你 可 能 
需要 使 用 -S 开关 在 Python 启动 时 关闭 它 。 你 也 可 以 完成 一 些 site 相关 的 自 定 义 操作 ， 
例如 在 路 径 导 入 完成 后 在 男 个 地 方 尝试 。 

€ zipimport - 你 可 以 使 用 该 模块 导入 ZIP 归档 文件 中 的 模块 。 需要 注意 的 是 该 功能 已 经 ” 

自动 “开启 ， 所 以 你 不 需要 在 任何 应 用 中 使 用 它 。 在 这 里 我 们 提出 它 只 是 作为 参考 。 

@ distutils - 该 模块 提供 了 对 建立 、 安装 、 分 发 Python 模块 和 包 的 文 持 。 它 还 可 以 帮助 
建立 使 用 C/C++ 完成 的 Python 扩展 。 更 多 关于 distutils 的 信息 可 以 在 Python 文档 

里 找到 ， 参 阅 : 
http://docs. python. org/dist/dist. html 


http://docs. python. org/inst/inst. html 


12.10 练习 


12-1. 路 径 搜 索 和 搜索 路 径 。 路 径 搜 索 和 搜索 路 径 之 间 有 什么 不 同 ? 
12-2. 导入 属性 。 假设 你 的 模块 mymodule 里 有 一 个 foo) 函数 。 
(a) 把 这 个 函数 导入 到 你 的 名 称 空 间 有 哪 两 种 方法 ? 
(b) 这 两 种 方法 导入 后 的 名 称 空 间 有 什么 不 同 ? 
12-3. GA. "import module” 4l "fromn module import *” 有 什么 不 同 ? 
12-4. 名 称 空间 和 变量 作用 域 。 名 称 空间 和 变量 作用 域 有 什么 不 同 ? 
12 - 5. 使 用 import Q. 
(a) 使 用 — import 把 一 个 模块 导入 到 你 的 名 称 空 间 。 你 最 后 使 用 了 什么 样 的 语法 ? 
(b) 和 上 边 相 同 ， 使 用 import () 从 指定 模块 导入 特定 的 名 字 。 
12-6. 扩展 导入 。 创 建 一 个 importAs() 函数 ， 这 个 函数 可 以 把 一 个 模块 导入 到 你 的 名 称 空 
间 ， 但 使 用 你 指定 的 名 字 ， 而 不 是 原始 名 字 。 例如 ， 调 用 newname=importAs( mymodule') 会 导入 
mymodule ， 但 模块 和 它 的 所 有 元 素 都 通过 新 名 称 newname 或 newname.attr 访问 。 这 是 Python 
2.0 引入 的 扩展 导入 实现 的 功能 。 
12-7. SAMS. 研究 PEP 302 的 导入 钩子 机 制 ， 实现 你 自己 的 导入 机 制 ， 人 允许 编 码 你 的 
模块 (encryption，bzip2，rot13， 等 )， 这 样 解释 器 会 自动 解码 它们 并 正确 导入 。 你 可 以 参看 zip 
文件 导入 的 实现 (参阅 第 12.5.7 T9. 
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Chapter 1 3 


在 我 们 的 描绘 中 ， 类 最 终 解释 了 面向 对 象 编程 思想 (00P) 。 本 章 中 ， 我 们 首先 将 给 出 一 个 总 体 上 
的 概述 ， 涵 盖 了 Python 中 使 用 类 和 OOP 的 所 有 主要 方面 。 其 余部 分 针对 类 ， 类 实例 和 方法 进行 详细 
探讨 。 我 们 还 将 描述 Python 中 有 关 派 生 或 子 类 化 及 继承 机 理 。 最 后 ，Python 可 以 在 特定 功能 方面 定 
制 类 , 例如 重 载 操作 符 , 模拟 Python 类 型 等 。 我 们 将 展示 如 何 实现 这 些 特殊 的 方法 来 自 定义 你 的 类 ， 


以 让 它们 表现 得 更 像 Python 的 内 建 类 型 。 
然而 ,除了 这 些 外 ， Python 的 面向 对 象 编程 (00P) 还 有 一 些 令 人 兴奋 的 变动 。 在 版 本 2. 2 中 ， 


Python 社区 最 终 统一 了 类 型 (types) MIA (classes), 新 式 类 具备 更 多 高 级 的 OOP 特性 ,扮演 了 一 个 
经 典 类 (或 者 说 旧式 类 ) 超 集 的 角色 ， 后 者 是 Python 诞生 时 所 创造 的 类 对 象 。 
下 面 ， 我 们 首先 介绍 在 两 种 风格 的 类 ( 译 者 注 : 新 式 类 和 旧式 类 ) 中 都 存在 的 核心 特性 ， 然 后 讲 
解 那些 只 有 新 式 类 才 拥 有 的 的 高 级 特性 。 
















































































13.1 介绍 


在 摸 清 OOP 和 类 的 本 质 之 前 ， 我 们 首先 讲 一 些 高 级 主题 ， 然 后 通过 几 个 简单 的 例子 热 一 热身 。 
如 果 你 刚 学 习 面 向 对 象 编 程 ， 你 可 以 先 跳 过 这 部 分 内 容 ， 直 接 进 入 第 13. 2 节 。 如 果 你 对 有 关 面 向 对 
象 编程 已 经 熟悉 了 ， 并 且 想 了 解 它 在 Python 中 是 怎样 表现 的 ， 那 么 先 看 一 下 这 部 分 内 容 ， 然 后 再 进 
入 13. 3 节 ， 看 个 究竟 ! 

在 Python 中 ， 面 向 对 象 编 程 主要 有 两 个 主题 ， 就 是 类 和 类 实例 OLA 13-1) 




















类 与 实例 





类 与 实例 相互 关联 着 : 类 是 对 象 的 定义 ， 而 实例 是 “真正 的 实物 ”， 它 存放 了 类 中 所 定义 的 对 象 
的 具体 信息 。 


$ 
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下 面 的 示例 展示 了 如 何 创 建 一 个 类 ; 

class MyNewOb jectType (bases) : 
"define MyNewObjectType class’ 
class suite ff 


关键 字 是 class， 紧 接着 是 一 个 类 名 。 随 后 是 定义 类 的 类 体 代码 。 这 里 通常 由 各 种 各 样 的 定义 和 
声明 组 成 。 新 式 类 和 经 典 类 声明 的 最 大 不 同 在 于 ， 所 有 新 式 类 必须 继承 至 少 一 个 父 类 ， 参 数 bases 
可 以 是 一 个 〈 单 继承 ) 或 多 个 (多 重 继承 ) 用 于 继承 的 父 类 。 

object 是 “所 有 类 之 母 ” 如果 你 的 类 没有 继承 任何 其 他 父 类 ，object 将 作为 默认 的 父 类 。 它 
位 于 所 有 类 继承 结构 的 最 上 层 。 如 果 你 没有 直接 或 间接 的 子 类 化 一 个 对 象 ， 那 么 你 就 定义 了 一 个 经 


BIS. 





class MyNewObjectType: 
"define MyNewObjectType classic class’ 
class suite 


如 果 你 没有 指定 一 个 父 类 ， 或 者 如 果 所 子 类 化 的 基本 类 没有 父 类 ， 你 这 样 就 是 创建 了 一 个 经 典 
类 。 很 多 Python 类 都 还 是 经 典 类 。 即 使 经 典 类 已 经 过 时 了 ， 在 以 后 的 Python 版 本 中 ， 仍 然 可 以 使 
用 和 它们。 不 过 我 们 强烈 推荐 你 尽 可 能 使 用 新 式 类 ， 尽 管 对 于 学 习 来 说 ， 两 者 都 行 。 








t 1 





e. 
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图 13-1 左边 的 工厂 制造 机 器 相当 于 类 ， 而 生产 出 来 的 玩具 就 是 它们 各 个 类 的 实例 。 尽 管 每 个 
实例 都 有 一 个 基本 的 结构 ， 但 各 自 的 属性 像 颜色 或 太 寸 可 以 改变 一 -一 这 就 好 比 实例 的 属性 。 











创建 一 个 实例 的 过 程 称 作 实例 化 ， 过 程 如 下 (注意 ; 没有 使 用 new 关键 字 ): 
myFirstObject = MyNewObjectType Q 


类 名 使 用 我 们 所 熟悉 的 函数 操作 符 〔())， 以 “函数 调用 ”的 形式 出 现 。 然 后 你 通常 会 把 这 个 新 
建 的 实例 赋 给 一 个 变量 。 赋 值 在 语法 上 不 是 必须 的 ， 但 如 果 你 没有 把 这 个 实例 保存 到 一 个 变量 中 ， 
它 就 没 用 了 ， 会 被 自动 垃圾 收集 器 回收 ， 因 为 任何 引用 指向 这 个 实例 。 这 样 ， 你 刚刚 所 做 的 一 切 ， 
就 是 为 那个 实例 分 配 了 一 块 内 存 ， 随 即 又 释放 了 它 。 














只 要 你 需要 ， 类 可 以 很 简单 ， 也 可 以 很 复杂 。 最 简单 的 情况 ， 类 仅 用 作 名 称 空间 (namespaces) 
(参见 第 11 章 )。 这 意味 着 你 把 数据 保存 在 变量 中 ， 对 他 们 按 名 称 空间 进行 分 组 ， 使 得 他 们 处 于 同 
样 的 关系 空间 中 一 -一 所 谓 的 关系 是 使 用 标准 Python 句点 属性 标识 。 比 如 ， 你 有 一 个 本 身 没有 任何 
属性 的 类 ， 使 用 它 仅 对 数据 提供 一 个 名 字 空 间 ， 让 你 的 类 拥有 像 Pascal 中 的 记录 集 (records) 和 C 
语言 中 的 结构 体 〈structures) 一 样 的 特性 ， 或 者 换 句 话说 ， 这 样 的 类 仅 作 为 容器 对 象 来 共享 名 字 


空间 。 
示例 如 下 : 


class MyData (object): 
pass 


IN 





a aa + 
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语句 。 这 种 情况 ， 必 要 的 代码 就 是 类 体 ， 但 我 们 暂 不 想 提供 这 些 。 上 面 定义 的 类 没有 任何 方法 或 属 
性 。 


Edit By Vheavens 























注意 有 的 地 方 在 语法 构成 上 需要 有 一 行 语句 , 但 实际 上 不 需要 做 任何 操作 , 这 时 候 可 以 使 用 pass 


























下 面 我 们 创建 一 个 实例 ， 它 只 使 用 类 作为 名 称 空间 容器 。 


22» mathObj = MyData Q 
222 mathÜbj.x = 4 

2225 mathObj. y = 5 

>>> mathObj. x + mathObj. y 
9 

>>> mathObj. x * mathObj. y 
20 


我 们 当然 也 可 以 使 用 变量 “x”“y? 来 完成 同样 的 事情 ,但 本 例 中 , 实例 名 字 mathOb j 将 mathOb j. x 





和 mathObj. y 关联 起 来 。 这 就 是 我 们 所 说 的 使 用 类 作为 名 字 空 间 容 器 。math0bj.x 和 mathObj.y 是 
实例 属性 ， 因 为 它们 不 是 类 MyData 的 属性 ， 而 是 实例 对 象 (math0bj) 的 独 有 属性 。 本 章 后 面 ， 我 
们 将 看 到 这 些 属性 实质 上 是 动态 的 : 你 不 需要 在 构造 器 中 , 或 其 它 任何 地 方 为 它们 预先 声明 或 者 赋值 。 





























方法 





我 们 改进 类 的 方式 之 一 就 是 给 类 添加 功能 。 类 的 功能 有 一 个 更 通俗 的 名 字 叫 方法 。 在 Python 














中 ， 方 法 定义 在 类 定义 中 ， 但 只 能 被 实例 所 调用 。 也 就 是 说 ， 调 用 一 个 方法 的 最 终 途 径 必 须 是 这 样 


的 : 








(1) 定义 类 (和 方法 )，(2) 创建 一 个 实例 〈3) 最 后 一 步 ， 用 这 个 实例 调用 方法 。 例 如 : 





class MyDataWithMethod(object): # XB 
def printFoo(self): # €X AY 
print 'You invoked printFoo()!' 








你 可 能 注意 到 了 self 参数 ， 它 在 所 有 的 方法 声明 中 都 存在 。 这 个 参数 代表 实例 对 象 本 身 ， 当 你 











用 实例 调用 方法 时 ， 由 解释 器 悄悄 地 传递 给 方法 的 ， 所 以 ， 你 不 需要 自己 传递 self 进来 ， 因 为 它 是 
自动 传 入 的 。 举例 说 明 一 下 , 假如 你 有 一 个 带 两 参数 的 方法 ， 所 有 你 的 调用 只 需要 传递 第 二 个 参数 ， 
Python 把 self 作为 第 一 个 参数 传递 进来 ， 如 果 你 犯错 的 话 ， 也 不 要 紧 。Python 将 告诉 你 传 入 的 参 
数 个 数 有 误 。 总 之 ， 你 只 会 犯 一 次 错 ， 下 一 次 一 一 一 你 当然 就 记得 了 ! 





























这 种 需要 在 每 个 方法 中 给 出 实例 Celf) 的 要 求 对 于 那些 使 用 C++ 或 Java 的 人 ， 可 能 是 一 种 新 


的 体验 ， 所 以 请 意识 到 这 点 。 





Python 的 哲学 本 质 上 就 是 要 明白 清晰 。 在 其 它 语言 中 ，self MOS "this". 可 以 在 13.7 节 的 “ 核 











心 笔记 ”中 找到 有 关 self 更 多 内 容 。 一 般 的 方法 会 需要 这 个 实例 (self), 而 静态 方法 或 类 方法 不 会 ， 
其 中 类 方法 需要 类 而 不 是 实例 。 在 第 13. 8 节 中 可 以 看 到 有 关 静 态 方 法 和 类 方法 的 更 多 内 容 。 
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现在 我 们 来 实例 化 这 个 类 ， 然 后 调用 那个 方法 : 











2» myObj = MyDataWithMethod OO # GY fä 
>> myObj.printFooQ # MEWAH? 
You invoked printFoo Q ! 

















在 本 节 结 束 时 ， 我 们 用 一 个 稍 复杂 的 例子 来 总 结 一 下 这 部 分 内 容 ， 这 个 例子 给 出 如 何 处 理 类 《〈 和 
实例 )， 还 介绍 了 一 个 特殊 的 方法 _init 0O， 子 类 化 及 继承 。 














对 于 已 熟悉 面向 对 象 编 程 的 人 来 说 ，_ init 0 类 似 于 类 构造 器 。 如 果 你 初 涉 00P 世界 ， 可 以 
认为 一 个 构造 器 仅 是 一 个 特殊 的 方法 ， 它 在 创建 一 个 新 的 对 象 时 被 调用 。 在 Python 中 ，_ init. 0 
实际 上 不 是 一 个 构造 器 。 你 没有 调用 “new” 来 创建 一 个 新 对 象 。(Python 根本 就 没有 “new” 关 键 字 )。 
取而代之 ，Python 创建 实例 后 ， 在 实例 化 过 程 中 ， 调 用 _init 0 〇 方法， 当 一 个 类 被 实例 化 时 ， 就 
可 以 定义 额外 的 行为 , 比如 , 设 定 初始 值 或 者 运行 一 些 初步 诊断 代码 一 一 一 主要 是 在 实例 被 创建 后 ， 
实例 化 调用 返回 这 个 实例 之 前 ， 去 执行 某 些 特定 的 任务 或 设置 。 





























(我 们 将 把 print 语句 添加 到 方法 中 ， 这 样 我 们 就 清楚 什么 时 候 方法 被 调用 了 。 通 第， 我 们 不 把 
输入 或 输出 语句 放 入 函数 中 ， 除 非 预 期 代码 体 具 有 输出 的 特性 。) 





创建 一 个 类 (类 定义 ) 


class AddrBookEntry (object): # ZEX 
'address book entry class’ 
def init (self, nm ph): # ig X fA 
self. name = nm # KE name 
self. phone = ph # KE phone 
print ‘Created instance for:', self. name 
def updatePhone (self, newph): # EX 
self. phone = newph 
print “Updated phone# for:', self. name 





在 AddrBookEntry 类 的 定义 中 ， 定 义 了 两 个 方法 : _init OM updatePhone(). init (Q 
在 实例 化 时 被 调用 ， 即 ， 在 AddrBookEntry 被 调用 时 。 你 可 以 认为 实例 化 是 对 init 0 的 一 种 隐 
式 的 调用 , 因为 传 给 AddrBookEntry O 的 参数 完全 与 _init 0 〇 接收 到 的 参数 是 一 样 的 (除了 self, 
它 是 自动 传递 的 )。 


回忆 一 下 ， 当 方法 在 实例 中 被 调用 时 ，self〈 实 例 对 象 ) 参数 自动 由 解释 器 传递 ， 所 以 在 上 面 
Hj init (0 中 ， 需 要 的 参数 是 nm 和 ph， 它 们 分 别 表示 名 字 和 电话 号 码 。_init 0 在 实例 化 时 ， 
设置 这 两 个 属性 ， 以 便 ， 在 实例 从 实例 化 调用 中 返回 时 ， 这 两 个 属性 对 程序 员 是 可 见 的 了 。 你 可 能 
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已 猜 到 ，updatePhone 0 方法 的 目的 是 普 换 地 址 本 条 目的 电话 号 码 属 








BE 





创建 实例 〈 实 例 化 ) 


2» john = AddrBookEntry( John Doe’, '408-555-1212') #A John Doe ty 
22» jane = AddrBookEntry (Jane Doe’, '650-555-1212') #A Jane Doe Vf 


这 就 是 实例 化 调用 ， 它 会 自动 调用 init O. self 把 实例 对 象 自动 传 入 _init ()。 你 可 以 
在 脑子 里 把 方法 中 的 self 用 实例 名 蔡 换 掉 。 在 上 面 第 一 个 例子 中 ， 当 对 象 john 被 实例 化 后 ， 它 的 
john. name 就 被 设置 了 ， 你 可 在 下 面 得 到 证 实 。 














另外 ， 如 果 不 存 在 默认 的 参数 ， 那 么 传 给 ”init 0 的 两 个 参数 在 实例 化 时 是 必须 的 。 





访问 实例 属性 


>>> John 

€ main .AddrBookEntry instance at 80ee610» 
>>> John. name 

' John Doe’ 

>>> john. phone 

"408-555-1212" 

222 Jane. name 

' Jane Doe’ 
>>> jane. phone 

"850-555-1212" 

















一 旦 实例 被 创建 后 ， 就 可 以 证 实 一 下 , 在 实例 化 过 程 中 , 我 们 的 实例 属性 是 否 确实 被 _init O 
设置 了 。 我 们 可 以 通过 解释 器 “ 转 储 ” 实 例 来 查看 它 是 什么 类 型 的 对 象 。( 我 们 以 后 将 学 到 如 何 定制 
类 来 获得 想 要 的 Python 对 象 字 符 串 的 输出 形式 ， 而 不 是 现在 看 到 的 默认 的 Python 对 象 字 符 串 

(<...>) 























方法 调用 (通过 实例 ) 


MM john. updatePhone ( 415-855-1212’) iE 3r John Doe HY iF 
>>> john. phone 
' 415-555-1212” 








updatePhone () 方 法 需要 一 个 参数 〈 不 计 self ÆA): 新 的 电话 号 码 。 在 updatePhone O 之 后 ， 








立即 检查 实例 属性 ， 可 以 证 实 已 生效 。 


E 
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创建 子 类 


靠 继承 来 进行 子 类 化 是 创建 和 定制 新 类 类 型 的 一 种 方式 ， 新 的 类 将 保持 已 存在 类 所 有 的 特性 ， 
而 不 会 改动 原来 类 的 定义 〈 指 对 新 类 的 改动 不 会 影响 到 原来 的 类 ， 译 者 注 )。 对 于 新 的 类 类 型 来 说 ， 
这 个 新 的 子 类 可 以 定制 只 属于 它 的 特定 功能 。 除 了 与 父 类 或 基 类 的 关系 外 ， 子 类 与 通常 的 类 没有 什 
么 区 别 ， 也 像 一 般 类 一 样 进行 实例 化 。 注 意 下 面 ， 子 类 声明 中 提 到 了 父 类 : 





























class EmplAddrBookEntry (AddrBookEntry) : 
’Employee Address Book Entry class #74 THAUERKEA 
def | init (self, nm ph, id, em): 
AddrBookEntry. init (self, nm, ph) 
self. empid — id 
self. email = em 


def updateEmail(self, newem): 
self. email = newem 
print “Updated e-mail address for:', self. name 


现在 我 们 创建 了 第 一 个 子 类 ，EmplAddrBookEntry。Python 中 ， 当 一 个 类 被 派生 出 来 ， 子 类 继 
承 了 基 类 的 属性 ， 所 以 ， 在 上 面 的 类 中 ， 我 们 不 仅 定 义 了 _init QO，updatEmail() 方 法 ， 而 且 
EmplAddrBookEntry 还 从 AddrBookEntry 中 继承 了 updatePhone () 方 法 。 


























如 果 需 要 ， 每 个 子 类 最 好 定义 它 自己 的 构造 器 ， 不 然 ， 基 类 的 构造 器 会 被 调用 。 然 而 ， 如 果子 
类 重 写 基 类 的 构造 器 ， 基 类 的 构造 器 就 不 会 被 自动 调用 了 一 一 这 样 ， 基 类 的 构造 器 就 必须 显 式 写 出 
才 会 被 执行 ， 像 我 们 上 面 那样 ， 用 AddrBookEntry. init 0 设置 名 字 和 电话 号 码 。 我 们 的 子 类 在 
构造 器 后 面 几 行 还 设置 了 另外 两 个 实例 属性 : 员工 ID 和 E-mail 地 址 。 








—= 








注意 ， 这 里 我 们 要 显 式 传递 self 实例 对 象 给 基 类 构造 器 ， 因 为 我 们 不 是 在 其 实例 中 调用 那个 方 
法 而 是 在 一 个 子 类 实例 中 调用 那个 方法 。 因 为 我 们 不 是 通过 实例 来 调用 它 ， 这 种 未 绑 定 的 方法 调用 
需要 传递 一 个 适当 的 实例 (self) 给 方法 。 























本 小 节 后 面 的 例子 ， 告 诉 我 们 如 何 创 建 子 类 的 实例 ， 访 问 它 们 的 属性 及 调用 它 的 方法 ， 包 括 从 
父 类 继承 而 来 的 方法 。 








fH T3 


225 john = EmplAddrBookEntry (John Doe’, '408-555-1212', 42, ' john@spam. doe’) 
Created instance for: John Doe #4 John Doe BJZ St fij 


>>> John 
€ main _.EmplAddrBookEntry object at 0x62030» 
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225^ John. name 
' John Doe’ 
>>> John. phone 
'408-555-1212' 
>>> John. email 
' Jjohn@spam. doe’ 
2^» john. updatePhone ( 415-555-1212") Updated phone# for: John Doe 
>>> John. phone 
'415-555-1212' 
2^» john. updateEmail(  johnédoe. spam’) Updated e-mail address for: John Doe 
25^ John. email 
' Jjohn@doe. spam’ 





核心 笔记 : 命名 类 、 属 性 和 方法 
类 名 通常 由 大 写字 母 打头 。 这 是 标准 惯例 ， 可 以 帮助 你 识别 类 ， 特 别 是 在 实例 化 过 程 中 (有 时 看 
起 来 像 函 数 调用 ) 。 还 有 ， 数 据 属性 ( 译 者 注 : 变量 或 常量 ) 听 起 来 应 当 是 数据 值 的 名 字 ， 方 法 名 应 
当 指 出 对 应 对 象 或 值 的 行为 。 另 一 种 表达 方式 是 : 数据 值 应 该 使 用 名 词 作为 名 字 , 方法 使 用 谓词 ( 动 
词 加 对 象 )。 数 据 项 是 操作 的 对 象 、 方 法 应 当 表 明 程 序 员 想 要 在 对 象 进行 什么 操作 。 在 上 面 我 们 定义 
的 类 中 ， 遵 循 了 这 样 的 方针 ， 数 据 值 像 “name”，“phone” 和 “email1”， 行 为 如 “updatePhone ”， 
$ “updateEmail” 这 就 是 常 说 的 “ 泥 合 记 法 (mixedCase) ”或 “骆驼 记 法 (camelCase) ”Python 3X E 





TG dE (eA see FRIAS, Eben, “update phone", “update email". 3&18XÉZg8 dn, 
像 “AddrBookEntry”“RepairShop” 等 等 就 是 很 好 的 名 字 。 











我 希望 你 已 初步 理解 如 何在 Python 中 进行 面向 对 象 编程 了 。 本 章 其 它 小 节 将 带 你 深入 面向 对 象 
编程 ，Python 类 及 实例 的 方方面面 。 





13. 2 面向 对 象 编 程 


编程 的 发 展 已 经 从 简单 控制 流 中 按 步 的 指令 序列 进入 到 更 有 组 织 的 方式 中 ， 依 靠 代码 块 可 以 形 
成 命名 子 程序 和 完成 既定 的 功能 。 结 构 化 的 或 过 程 性 编程 可 以 让 我 们 把 程序 组 织 成 逻辑 块 ， 以 便 重 
复 或 重用 。 创 建 程序 的 过 程 变 得 更 具 逻 辑 性 ， 选 出 的 行为 要 符合 规范 ， 才 可 以 约束 创建 的 数据 。 迪 
特 尔 父子 (这 里 指 DEITEL 系列 书籍 作者 Harvey M. Deitel 和 Paul James Deitel 父子 ， 译 者 注 ) iA 
为 结构 化 编程 是 “面向 行为 ”的 ， 因 为 事实 上 ， 即 使 没有 任何 行为 的 数据 也 必须 “规定 ”逻辑 性 。 




































































然而 ， 如 果 我 们 能 对 数据 加 上 动作 呢 ? 如 果 我 们 所 创建 和 编写 的 数据 片段 ， 是 真实 生活 中 实体 
的 模型 ， 内 髓 数据 体 和 动作 呢 ? 如 果 我 们 能 通过 一 系列 已 定义 的 接口 (又 称 存 取 函数 集合 ) 访 问 数据 
属性 ， 像 自动 取款 机 卡 或 能 访问 你 的 银行 帐号 的 个 人 支票 ， 我 们 就 有 了 一 个 “对 象 ”系统 ， 从 大 的 
方面 来 看 ， 每 一 个 对 象 既 可 以 与 自身 进行 交互 ， 也 可 以 与 其 它 对 象 进行 交互 。 


n 4 


Edit By Vheavens 



































Edit By Vheavens 


ee 








面向 对 象 编 程 踩 上 了 进化 的 步伐 ， 增 强 了 结构 化 编程 ， 实 现 了 数据 与 动作 的 融合 : BAe 
辑 层 现在 由 一 个 可 用 以 创建 这 些 对 象 的 简单 抽象 层 来 描述 。 现 实 世 界 中 的 问题 和 实体 完全 峻 露 了 本 
质 ， 从 中 提供 的 一 种 抽象 ， 可 以 用 来 进行 相似 编码 ， 或 者 编 入 能 与 系统 中 对 象 进 行 交互 的 对 象 中 。 
类 提供 了 这 样 一 些 对 象 的 定义 ， 实 例 即 是 这 些 定义 的 实现 。 二 者 对 面向 对 象 设计 Cobject-oriented 
design, OOD) 来 说 都 是 重要 的 ，00D 仅 意味 来 创建 你 采用 面向 对 象 方式 架构 来 创建 系统 。 



























































13. 2. 1 面向 对 象 设计 与 面向 对 象 编程 的 关系 











面向 对 象 设计 (00D) 不 会 特别 要 求 面 向 对 象 编程 语言 。 事 实 上 ，00D 可 以 由 纯 结 构 化 语言 来 实 
现 ， 比 如 C， 但 如 果 想 要 构造 具备 对 象 性 质 和 特点 的 数据 类 型 ， 就 需要 在 程序 上 作 更 多 的 努力 。 当 一 
门 语言 内 建 00 特性 ，00 编程 开发 就 会 更 加 方便 高 效 。 























另 一 方面 ， 一 门面 向 对 象 的 语言 不 一 定 会 强制 你 写 00 方面 的 程序 。 例 如 C++ 可 以 被 认为 “更 好 
的 C” 而 Java， 则 要 求 万 物 皆 类 ， 此 外 还 规定 ， 一 个 源 文件 对 应 一 个 类 定义 。 然 而 ， 在 Python 中 ， 
类 和 OOP 都 不 是 日 常 编程 所 必需 的 。 尽 管 它 从 一 开始 设计 就 是 面向 对 象 的 ， 并 且 结 构 上 支持 00P,， 但 
Python 没有 限定 或 要 求 你 在 你 的 应 用 中 写 00 的 代码 。00P 是 一 门 强大 的 工具 ， 不 管 你 是 准备 进入 ， 
~~, PE, 或 是 转向 00P， 都 可 以 任意 支配 。 


$ 13. 2. 2 现实 世界 中 的 问题 E 


考虑 用 OOD 来 工作 的 一 个 最 重要 的 原因 ， 在 于 它 直 接 提供 建 模 和 解决 现实 世界 问题 和 情形 的 途 
径 。 比 如 ， 让 你 来 试 着 模拟 一 台 汽车 维修 店 ， 可 以 让 你 停车 进行 维修 。 我 们 需要 建 两 个 一 般 实 体 : 
处 在 一 个 “系统 ”中 并 与 其 交互 的 人 类 ， 和 一 个 修理 店 ， 它 定义 了 物理 位 置 ， 用 于 人 类 活动 。 因 为 
前 者 有 更 多 不 同 的 类 型 ， 我 将 首先 对 它 进行 描述 ， 然 后 描述 后 者 。 在 此 类 活动 中 ， 一 个 名 为 Person 
的 类 被 创建 以 用 来 表示 所 有 的 人 。Person 的 实例 可 以 包括 消费 者 (Customer) ， 技 工 Mechanic), ， 还 
可 能 是 出 纳 员 (Cashier) 。 这 些 实例 具有 相似 的 行为 ， 也 有 独一无二 的 行为 。 比 如 ， 他 们 能 用 声音 ; 
ÍT. MMA talk 0 〇 方法 ， 还 有 drive car OO 方法。 不 同 的 是 ， 技 工 有 repair_car OO 方法， 而 出 纳 
#A ring sale) AYE. 技工 有 一 个 repair certification 属性 ,而 所 有 人 都 有 一 个 drivers license 
属性 。 


























































































































最 后 ， 所 有 这 些 实例 都 是 一 个 检查 (overseeing) 类 RepairShop 的 参与 者 ， 后 者 具有 一 个 叫 
operating hours 的 数据 属性 , 它 通 过 时 间 函 数 来 确定 何 时 顾客 来 修 车 ， 何 时 职员 技工 和 出 纳 员 来 上 
HE. RepairShop 可 能 还 有 一 个 AutoBay 类 ， 拥 有 SmogZone, TireBrakeZone 等 实例 ， 也 许 还 有 一 个 叫 
GeneralRepair 的 实例 。 












































我 们 所 编 的 RepairShop 的 一 个 关键 点 是 要 展示 类 和 实例 加 上 它们 的 行为 是 如 何 用 来 对 现实 生活 
场景 建 模 的 。 同 样 ， 你 可 以 把 诸如 机 场 ， 餐 厅 ， 晶 上 营 ， 医 院 ， 其 至 一 个 邮 订 音乐 公司 想像 为 类 ， 它 
们 完全 具备 各 自 的 参与 者 和 功能 性 。 
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13. 2. 3* 常 用 术语 


对 于 已 熟悉 有 关 OOP 术语 的 朋友 来 说 ， 看 Python 中 是 怎么 称呼 的 : 


抽象 /实现 





抽象 指 对 现实 世界 问题 和 实体 的 本 质 表 现 ， 行 为 和 特征 建 模 ， 建 立 一 个 相关 的 子 集 ， 可 以 用 于 
描绘 程序 结构 ， 从 而 实现 这 种 模型 。 抽 象 不 仅 包 括 这 种 模型 的 数据 属性 ,还 定义 了 这 些 数 据 的 接口 。 
对 某 种 抽象 的 实现 就 是 对 此 数据 及 与 之 相关 接口 的 现实 化 realization) 。 现 实 化 这 个 过 程 对 于 客户 
程序 应 当 是 透明 而 且 无 关 的 。 














封装 /接口 


封 效 描述 了 对 数据 /信息 进行 隐藏 的 观念 ， 它 对 数据 属性 提供 接口 和 访问 函数 。 通 过 任何 客户 站 
直接 对 数据 的 访问 ， 无 视 接 口 ， 与 封装 性 都 是 背道而驰 的 ， 除 非 程序 员 人 允许 这 些 操 作 。 作 为 实现 的 
一 部 分 ， 客 户 端 根本 就 不 需要 知道 在 封装 之 后 ， 数 据 属 性 是 如 何 组 织 的 。 在 Python 中 ， 所 有 的 类 属 
性 都 是 公开 的 ， 但 名 字 可 能 被 “混淆 ”了 ， 以 阻止 未 经 授权 的 访问 ， 但 仅 此 而 已 ， 再 没有 其 他 预防 
措施 了 。 这 就 需要 在 设计 时 ， 对 数据 提供 相应 的 接口 ， 以 免 客 户 程 序 通过 不 规范 的 操作 来 存 取 封装 
的 数据 属性 。 












































合成 


合成 扩充 了 对 类 的 描述 ， 使 得 多 个 不 同 的 类 合成 为 一 个 大 的 类 ， 来 解决 现实 问题 。 合 成 描述 了 
一 个 异常 复杂 的 系统 ， 比 如 一 个 类 由 其 它 类 组 成 ， 更 小 的 组 件 也 可 能 是 其 它 的 类 , 数据 属性 及 行为 ， 
所 有 这 些 合 在 一 起 ， 彼 此 是 “有 一 个 ”的 关系 。 比 如 ，RepairShop“ 有 一 个 ”技工 (应 该 至 少 有 一 个 
吧 ) ， 还 “有 一 个 ”顾客 (至 少 一 个 ) 。 




















这 些 组 件 要 么 通过 联合 关系 组 在 一 块 ， 意 思 是 说 ， 对 子 组 件 的 访问 是 允许 的 (对 RepairShop 来 
说 ， 顾 客 可 能 请 求 一 个 SmogCheck， 客 户 程 序 这 时 就 是 与 RepairShop 的 组 件 进行 交互 ), BARRA 
在 一 起 ， 封 装 的 组 件 仅 能 通过 定义 好 的 接口 来 访问 ， 对 于 客户 程序 来 说 是 透明 的 。 继 续 我 的 例子 ， 
客户 程序 可 能 会 建立 一 个 SmogCheck 请 求 来 代表 顾客 ， 但 不 能 够 同 RepairShop 的 SmogZone 部 分 进 
行 交互 ， 因 为 SmogZone 是 由 RepairShop 内 部 控制 的 ， 只 能 通过 smogCheckCar () 方 法 调用 。Python 
支持 上 述 两 种 形式 的 合成 。 
































派生 /继承 /继承 结构 





派生 描述 了 子 类 的 创建 ， 新 类 保留 已 存 类 类 型 中 所 有 需要 的 数据 和 行为 ， 但 允许 修改 或 者 其 它 
的 自 定 义 操 作 ， 都 不 会 修改 原 类 的 定义 。 继 承 描 述 了 子 类 属性 从 祖先 类 继承 这 样 一 种 方式 。 从 前 面 
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的 例子 中 ， 技 工 可 能 比 顾客 多 个 汽车 技能 属性 ， 但 单独 的 来 看 ， 每 个 都 “是 一 个 ” 人， 所以， 不 
对 谁 而 言 调用 talk 0 都 是 合法 得 ， 因 为 它 是 人 的 所 有 实例 共有 的 。 继 承 结构 表示 多 “ 代 ” 派 生 ， 可 
以 描述 成 一 个 “族谱 ”， 连 续 的 子 类 ， 与 祖先 类 都 有 关系 。 


























泛 化 / 特 化 





泛 化 表示 所 有 子 类 与 其 父 类 及 祖先 类 有 一 样 的 特点 ， 所 以 子 类 可 以 认为 同 祖先 类 是 “是 一 个 ” 
的 关系 ， 因 为 一 个 派生 对 象 《实例 ) 是 祖先 类 的 一 个 “例子 ”。 比 如 ， 技 工 “ 是 一 个 ”人 ， 车 “是 一 
个 ”交通 工具 ， 等 等 。 在 上 面 我 们 间接 提 到 的 族谱 图 中 ， 我 们 可 以 从 子 类 到 祖先 类 画 一 条 线 ， 表 示 
“是 一 个 ”的 关系 。 特 化 描述 所 有 子 类 的 自 定义 ， 也 就 是 ， 什 么 属性 让 它 与 其 祖先 类 不 同 。 



































多 态 的 概念 指出 了 对 象 如 何 通过 他 们 共同 的 属性 和 动作 来 操作 及 访问 ， 而 不 需 考虑 他 们 具体 的 
类 。 多 态 表 明了 动态 (又 名 ,运行 时 ) 绑 定 的 存在 ， 允 计 重 载 及 运行 时 类 型 确定 和 验证 。 




















自省 /反射 


自省 表示 给 予 你， 程序 员 ， 某 种 能 力 来 进行 像 “ 手 工 类 型 检查 ”的 工作 ， 它 也 被 称 为 有 反射。 这 
个 性 质 展示 了 某 对 象 是 如 何在 运行 期 取得 自身 信息 的 。 如 果 传 一 个 对 象 给 你 ， 你 可 以 查 出 它 有 什么 
能 力 ， 这 样 的 功能 不 是 很 好 吗 ? 这 是 一 项 强大 的 特性 ， 在 本 章 中 ， 你 会 时 常 遇 到 。 如 果 Python 不 
支持 某 种 形式 的 自省 功能 ，dir (和 typeO 内 建 函 数 ， 将 很 难 正 常 工 作 。 请 密切 关注 这 些 调 用 ， 还 
有 那些 特殊 属性 ， 像 _dict , name 及 doc 。 可 能 你 对 其 中 一 些 已 经 很 熟悉 了 ! 

















—- 











13. 3 类 








回想 一 下 ， 类 是 一 种 数据 结构 ， 我 们 可 以 用 它 来 定义 对 象 ， 后 者 把 数据 值 和 行为 特性 融合 在 
起 。 类 是 现实 世界 的 抽象 的 实体 以 编程 形式 出 现 。 实 例 是 这 些 对 象 的 具体 化 。 可 以 类 比 一 下 ， 类 是 
蓝图 或 者 模型 ， 用 来 产生 真实 的 物体 〈 实 例 )。 因 此 为 什么 是 术语 “class”? 这 个 术语 很 可 能 起 源 
于 使 用 类 来 识别 和 归 类 特定 生物 所 属 的 生物 种 族 ， 类 还 可 以 派生 出 相似 但 有 差异 的 子 类 。 编 程 中 类 
的 概念 就 应 用 了 很 多 这 样 的 特征 。 











在 Python 中 ， 类 声明 与 函数 声明 很 相似 ， 头 一 行 用 一 个 相应 的 关键 字 ， 接 下 来 是 一 个 作为 它 的 
定义 的 代码 体 ， 如 下 所 示 : 

def functionName (args): 

'function documentation string! HARRI ERE 

function suite ZA ZU 


class ClassName (object): 

















Edit By Vheavens 


t 





Edit By Vheavens 


ee 
T 


'class documentation string’ HABER ERE 
class suite HA K 








二 者 都 允许 你 在 他 们 的 声明 中 创建 函数 ， 闭 包 或 者 内 部 函数 〈 即 函数 内 的 函数 )， 还 有 在 类 中 定 
义 的 方法 。 最 大 的 不 同 在 于 你 运行 函数 ， 而 类 会 创建 一 个 对 象 。 类 就 像 一 个 Python 容器 类 型 。 在 这 
部 分 ， 我 们 将 特别 留意 类 及 它们 有 什么 类 型 的 属性 。 这 只 要 记 住 ， 尽 管 类 是 对 象 〈 在 Python f, — 
切 皆 对 象 )， 但 正 被 定义 时 ， 它 们 还 不 是 对 象 的 实现 。 在 下 节 中 会 讲 到 实例 ， 所 以 拭目以待 吧 。 不 过 
现在 ， 我 们 集中 讲解 类 对 象 。 



































当 你 创建 一 个 类 ， 你 就 实际 创建 了 一 个 你 自己 的 数据 类 型 。 所 以 这 个 类 的 实例 都 是 相似 的 ， 但 
类 之 间 彼 此 是 有 区 别 的 〈《 因 此， 不 同类 的 实例 自然 也 不 可 能 相同 了 )。 与 其 玩 那 些 从 玩具 商 那 买 来 的 
玩具 礼物 ， 为 什么 不 设计 并 创造 你 自己 的 玩具 来 玩 呢 ? 








类 还 允许 派生 。 你 可 以 创建 一 个 子 类 ， 它 也 是 类 ， 而 且 继 续 了 父 类 所 有 的 特征 和 属性 。 从 
Python2. 2 开始 ， 你 也 可 以 从 内 建 类 型 中 派生 子 类 ， 而 不 是 仅仅 从 其 它 类 。 








13. 3. 1 创建 类 








Python 类 使 用 class 关键 字 来 创建 。 简 单 的 类 的 声明 可 以 是 关键 字 后 紧 跟 类 名 : 


class ClassName (bases) : 





Ax 了 


'class documentation string’ # ZKI Ef 
class suite AA 


本 章 前 面 的 概述 中 提 到 ， 基 类 是 一 个 或 多 个 用 于 继承 的 父 类 的 集合 ; 类 体 由 所 有 声明 语句 ， 类 
成 员 定义 ， 数 据 属性 和 函数 组 成 。 类 通常 在 一 个 模块 的 顶层 进行 定义 ， 以 便 类 实例 能 够 在 类 所 定义 
的 源 代码 文件 中 的 任何 地 方 被 创建 。 
































13.3.2 声明 与 定义 





对 于 Python 函数 来 说 ， 声 明 与 定义 类 没什么 区 别 ， 因 为 他 们 是 同时 进行 的 ， 定 义 〈 类 体 ) 紧 跟 
在 声明 (S class 关键 字 的 头 行 Lheader line]) 和 可 选 ( 但 总 是 推荐 使 用 ) 的 文档 字符 串 后 面 。 同 时 ， 
所 有 的 方法 也 必须 同时 被 定义 。 如 果 对 OOP 很 熟悉 ， 请 注意 Python 并 不 支持 纯 虚 函数 〈 像 Ct+) 或 
者 抽象 方法 (如 在 JAVA 中 )， 这 些 都 强制 程序 员 在 子 类 中 定义 方法 。 作 为 蔡 代 方法 ， 你 可 以 简单 地 
在 基 类 方法 中 引发 NotImplementedError 异常 ， 这 样 可 以 获得 类 似 的 效果 。 























13. 4 类 属性 
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什么 是 属性 呢 ? 属性 就 是 属于 另 一 个 对 象 的 数据 或 者 函数 元 素 , 可 以 通过 我 们 熟悉 的 句点 属性 
标识 法 来 访问 。 — Python 类 型 比如 复数 有 数据 属性 〈 实 部 和 虚 部 )， 而 另外 一 些 ， 像 列表 和 字典 ， 
拥有 方法 《函数 属性 )。 














—- 





有 关 属 性 的 一 个 有 趣 的 地 方 是 ， 当 你 正 访 问 一 个 属性 时 ， 它 同时 也 是 一 个 对 象 ， 拥 有 它 自己 的 
属性 ， 可 以 访问 ， 这 导致 了 一 个 属性 链 ， 比 如 ，myThing, subThing, subSubThing. 等 等 。 常 见 例 子 如 
F: 

€ sys. stdout. write( foo’ ) 























€ print myModule.myClass. doc | 
€ myList. extend (map (upper, open( x ).readlines Q)) 








类 属性 仅 与 其 被 定义 的 类 相 绑 定 ， 并 且 因 为 实例 对 象 在 日 常 OOP 中 用 得 最 多 ， 实 例 数 据 属性 是 
你 将 会 一 直 用 到 的 主要 数据 属性 。 类 数据 属性 仅 当 需要 有 更 加 “静态 ”数据 类 型 时 才 变 得 有 用 ， 它 
和 任何 实例 都 无 关 , 因此 , 这 也 是 为 什么 下 一 节 被 表 为 高 级 主题 , 你 可 以 选读 。( 如 果 你 对 静态 不 熟 ， 
它 表 示 一 个 值 ， 不 会 因为 函数 调用 完毕 而 消失 ， 它 在 每 两 个 函数 调用 的 间隙 都 存在 。 或 者 说 ， 一 个 
类 中 的 一 些 数据 对 所 有 的 实例 来 说 ， 都 是 固定 的 。 有 关 静 态 数据 详细 内 容 ， 见 下 一 小 节 . ) 
































—— 














接 下 来 的 一 小 节 中 ， 我 们 将 简要 描述 ， 在 Python 中 ， 方 法 是 如 何 实现 及 调用 的 。 通 常 ，Python 
中 的 所 有 方法 都 有 一 个 限制 : 在 调用 前 ， 需 要 创建 一 个 实例 。 


$ 13. 4. 1 类 的 数据 属性 


数据 属性 仅仅 是 所 定义 的 类 的 变量 。 它 们 可 以 像 任何 其 它 变 量 一样 在 类 创建 后 被 使 有 用， 并且， 
要 么 是 由 类 中 的 方法 来 更 新 ， 要 么 是 在 主 程序 其 它 什 么 地 方 被 更 新 。 















































这 种 属性 已 为 00 程序 员 所 熟悉 ， 即 静态 变量 ， 或 者 是 静态 数据 。 它 们 表示 这 些 数据 是 与 它们 所 
属 的 类 对 象 绑 定 的 ， 不 依赖 于 任何 类 实例 。 如 果 你 是 一 位 Java 或 C++ 程序 员 ， 这 种 类 型 的 数据 相当 
于 在 一 个 变量 声明 前 加 上 static 关键 字 。 




















静态 成 员 通 常 仅 用 来 跟踪 与 类 相关 的 值 。 大 多 数 情况 下 ， 你 会 考虑 用 实例 属性 ， 而 不 是 类 属性 。 
在 后 面 ， 我 们 正式 介绍 实例 时 ， 将 会 对 类 属性 及 实例 属性 进行 比较 。 























看 下 面 的 例子 ， 使 用 类 数据 属性 (foo) : 
22^ class C(object) : 
foo = 100 





222 print C. foo 
100 
D>» C. foo = C. foo + 1 
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222 print C. foo 
101 





注意 ， 上 面 的 代码 中 ， 看 不 到 任何 类 实例 的 引用 。 


13.4.2 方法 





方法 ， 比 如 下 面 ， 类 MyClass 中 的 myNoActionMethod 方法 ， 仅 仅 是 一 个 作为 类 定义 一 部 分 定义 
的 函数 . (这 使 得 方法 成 为 类 属性 )。 这 表示 myNoActionMethod 仅 应 用 在 MyClass 类 型 的 对 象 ( 实 例 ) 
上 。 这 里 ，myNoActionMethod 是 通过 句点 属性 标识 法 与 它 的 实例 绑 定 的 。 

22^ class MyClass (object): 

def myNoActionMethod (self): 


pass 

















2» mc = MyClass Q 
222 mc. myNoActionMethod O 


任何 像 函数 一 样 对 myNoActionMethod 自 吴 的 调用 都 将 失败 : 
22^ myNoActionMethod() Traceback (innermost last): 
File ^&Xstdin^^, line 1, in ? 

myNoActionMethod 0 NameError: myNoActionMethod 





引发 了 NameError 异常 ， 因 为 在 全 局 名 字 空 间 中 ， 没 有 这 样 的 函数 存在 。 这 就 告诉 你 
myNoActionMethod 是 一 个 方法 ， 表 示 它 属于 一 个 类 ， 而 不 是 全 局 空间 中 的 名 字 。 如 果 
myNoActionMethod 是 在 顶层 作为 函数 被 定义 的 ， 那 么 我 们 的 调用 则 会 成 功 。 























下 面 展示 的 是 ， 甚 至 由 类 对 象 调 用 此 方法 也 失败 了 。 

22^ MyClass. myNoActionMethod() Traceback (innermost last): 
File “<stdim”*, line L in ? 

MyClass. myNoActionMethod () 

TypeError: unbound method must be called with class 


instance Ist argument 














TypeError 异常 初 看 起 来 很 让 人 困惑 ， 因 为 你 知道 这 种 方法 是 类 的 一 个 属性 ， 因 此 ， 一定 很 想 知 
道 为 何 为 失败 吧 ? 接 下 来 将 会 解释 这 个 问题 。 





绑 定 〈 绑 定 及 非 绑 定 方法 ) 








为 与 00P 惯例 保持 一 致 , Python 严格 要 求 , 没有 实例 , 方法 是 不 能 被 调用 的 。 这 种 限制 即 Python 








$— E 
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所 描述 的 绑 定 概念 binding) ， 在 此 ， 方 法 必须 绑 定 〈 到 一 个 实例 ) 才能 直接 被 调用 。 非 绑 定 的 方法 
可 能 可 以 被 调用 ， 但 实例 对 象 一 定 要 明确 给 出 ， 才 能 确保 调用 成 功 。 然 而 ， 不 管 是 否 绑 定 ， 方 法 都 
是 它 所 在 的 类 的 固有 属性 ， 即 使 它们 几乎 总 是 通过 实例 来 调用 的 。 在 13. 7 节 中 ， 我 们 会 更 深入 地 探 
索 本 主 ji o 















































13. 4. 2 决定 类 的 属性 























要 知道 一 个 类 有 哪些 属性 ， 有 两 种 方法 。 最 简单 的 是 使 用 dir 0 内 建 函 数 。 另 外 是 通过 访问 类 的 
字典 属性 _ dict ， 这 是 所 有 类 都 具备 的 特殊 属性 之 一 。 看 一 下 下 面 的 例子 : 
22» class MyClass (object): 
"MyClass class definition’ #MyClass BEX 
myVersion = 'L I! # static data EFE 
def showMyVersion (self): # method DÆ 
print MyClass. myVersion 




















根据 上 面 定义 的 类 ， 让 我 们 使 用 dir () 和 特殊 类 属性 ”dict 来 查看 一 下 类 的 属性 : 
222 dir MyClass) 








l' class ^, " delattr °, > dict °’, ` doe ”, 
” getattribute ’, ' hash 


Ei 3 


3 fi ti P4 a # 
new, reduce ^, _ reduce ex _ , repr, 








2 


> ^ init’, ' module ^, 











P4 P4 3 


” setattr /', str ', ' weakref °, 'myVersion', 





" showMyVersion’ J 
222 MyClass. dict . 
<dictproxy object at 0x62090» 


222 print MyClass. dict — 

( showMyVersion': «function showMyVersion at 0x593705, 
' dict ^': <attribute ' dict ' of 'MyClass' objects), 
'"myVersion': '1.1', ' weakref “: <attribute 
” weakref ”of 'MyClass' objects», ' doc . 
"MyClass class definition’! 


? . 








在 新 式 类 中 ， 还 新 增加 了 一 些 属性 ，dir 0 也 变 得 更 健壮 。 作 为 比较 ， 可 以 看 下 经 典 类 是 什么 样 
的 : 
222 dir MyClass) 
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[. doc ^", ' module’, 'showlyVersion', 'myVersion']/ 
225 

222 MyClass. dict . 

/ doce ’°: None, 'myVersion' : 1, 'showMyVersion': 
«function showMyVersion at 950ed05, ' 


^ main ^j 








J| module”: 


从 上 面 可 以 看 到 , dir 0 返回 的 仅 是 对 象 的 属性 的 一 个 名 字 列 表 , d dict_ 返回 的 是 一 个 字典 ， 
它 的 键 (keys) 是 属性 名 ， 键 值 (values) 是 相应 的 属性 对 象 的 数据 值 。 

















"m 


结果 还 显示 了 MyClass 类 中 两 个 熟悉 的 属性 ，showMyVersion 和 myVersion， 以 及 一 些 新 的 属 
性 。 这 些 属性 ， doc 及 module _ ， 是 所 有 类 都 具备 的 特殊 类 属性 (另外 还 有 _ dict ).. SE 
的 vars O 函数 接受 类 对 象 作为 参数 ， 返 回 类 的 _dict 属性 的 内 容 。 


A 











m 














|i 





13. 4. 3 特殊 的 类 属性 





对 任何 类 C， 表 13. 1 显示 了 类 C 的 所 有 特殊 属性 : 


表 13. 1 特殊 类 属性 

















C. name . 类 C 的 名 字 【〈 字 符 串 ) 
C. doc — 25 C 的 文档 字符 串 
C. bases . X C 的 所 有 父 类 构成 的 元 组 
C. dict - 2% C 的 属性 
C. module . X C 定义 所 在 的 模块 《〈1. 5 版 本 新 增 ) 
C. class . 实例 C 对 应 的 类 〈 仅 新 式 类 中 ) 


根据 上 面 定 义 的 类 MyClass， 有 如 下 结 

25^ MyClass. name - 

'"MyClass' 

222» MyClass. doc . 

MyClass class definition’ 

2225 MyClass. bases _ 

«type 'object/»,) 

2225 print MyClass. dict 

/ doc /': None, 'myVersion' : 1, 'showMyVersion': 
«function showMyVersion at 950ed0>, ' module 
222 MyClass. module . 

” main ” 

222 MyClass. class _ 





rd 


main 7} 
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«type 'type'^ 














name 是 给 定 类 的 字符 名 字 。 它 适用 于 那 种 只 需要 字符 第 〈 类 对 象 的 名 字 )， 而 非 类 对 象 本 身 
的 情况 。 甚 至 一 些 内 建 的 类 型 也 有 这 个 属性 , 我 们 将 会 用 到 其 中 之 一 来 展示 _name_ 字 符 串 的 益处 。 




















类 型 对 象 是 一 个 内 建 类 型 的 例子 ， 它 有 _name 的 属性 。 回 忆 一 下 ，type 0 返回 被 调用 对 象 的 
类 型 。 这 可 能 就 是 那 种 我 们 所 说 的 仅 需 要 一 个 字符 串 指 明 类 型 ， 而 不 需要 一 个 对 象 的 情况 。 我 们 能 
可 以 使 用 类 型 对 象 的 _name 属性 来 取得 相应 的 字符 串 名 。 如 下 例 示 : 

2» stype = type( What is your quest?’) 

2» stype # stype is a type object stype 4E — f 2SZHN 

«type string’ ^ 

>> stype. name  £ get type as a string fe dS UE (FIFRE) 

‘string’ 

225 

> type (3. 14159265) # also a type object X —f2S7HN/ A 

«type float’ > 

22» type (3. 14159265). name # get type as a string fA SIZEZE (FIFRE) 

float’ 























. doc_ 是 类 的 文档 字符 串 ， 与 函数 及 模块 的 文档 字符 串 相 似 ， 必 须 紧 随 头 行 (header line) 
后 的 字符 串 。 文 档 字符 串 不 能 被 派生 类 继承 ， 也 就 是 说 派生 类 必须 含有 它们 自己 的 文档 字符 串 。 











本 章 后 面 会 讲 到 ，_bases_ 用 来 处 理 继承 ， 它 包含 了 一 个 由 所 有 父 类 组 成 的 元 组 。 








前 述 的 _dict 属性 包含 一 个 字典 ， 由 类 的 数据 属性 组 成 。 访 问 一 个 类 属性 的 时 候 ，Python 解 
释 器 将 会 搜索 字典 以 得 到 需要 的 属性 。 WIRE dict ”中 没有 找到 , 将 会 在 基 类 的 字典 中 进行 搜索 ， 
采用 “深度 优先 搜索 ”顺序 。 基 类 集 的 搜索 是 按 顺序 的 ， 从 左 到 右 ， 按 其 在 类 定义 时 ， 定 义 父 类 参 
数 时 的 顺序 。 对 类 的 修改 会 仅 影响 到 此 类 的 字典 ， 基 类 的 _dict 属性 不 会 被 改动 的 。 
































Python 支持 模块 则 的 类 继承 。 为 更 清晰 地 对 类 进行 描述 ，1。1，1.5 版 本 中 引入 了 _module ， 
这 样 类 名 就 完全 由 模块 名 所 限定 。 看 一 下 下 面 的 例子 : 
2» class C(object): 


pass 








2> C 
<class | main .C at 0x53f90> 
2> C module _ 


3 . P4 
— main -— 


类 C 的 全 名 是 “ main .C", L7, source module. class_name。 如 果 类 C 位 于 一 个 导入 的 
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模块 中 ， 如 mymod， 像 下 面 的 : 
>>> from mymod import C 
Dee’ 
<class mymod. C at 0x53ea0^ 
2> C._ module _ 
'mymod' 





在 以 前 的 版 本 中 ， 没 有 特殊 属性 ”module ， 很 难 简单 定位 类 的 位 置 ， 因 为 类 没有 使 用 它们 的 
全 名 。 











最 后 ， 由 于 类 型 和 类 的 统一 性 ， 当 访问 任何 类 的 _class_ 属 性 时 ， 你 将 发 现 它 就 是 一 个 类 型 对 
象 的 实例 。 换 句 话说 ， 一 个 类 已 是 一 种 类 型 了 。 因 为 经 典 类 并 不 认同 这 种 等 价 性 (一 个 经 典 类 是 一 
个 类 对 象 ， 一 个 类 型 是 一 个 类 型 对 象 )， 对 这 些 对 象 来 说 ， 这 个 属性 并 未 定义 。 











13. 5 实例 








如 果 说 类 是 一 种 数据 结构 定义 类 型 ， 那 么 实例 则 声明 了 一 个 这 种 类 型 的 变量 。 换 言 之 ， 实 例 是 
有 生命 的 类 。 就 像 设 计 完 一 张 蓝 图 后 ， 就 是 设法 让 它 成 为 现实 。 实 例 是 那些 主要 用 在 运行 期 时 的 对 
象 ， 类 被 实例 化 得 到 实例 ， 该 实例 的 类 型 就 是 这 个 被 实例 化 的 类 。 在 Python2.2 版 本 之 前 ， 实 例 是 
“实例 类 型 ”， 而 不 考虑 它 从 哪个 类 而 来 。 




















13. 5. 1 初始 化 : 通过 调用 类 对 象 来 创建 实例 








很 多 其 它 的 00 语言 都 提供 new 关键 字 ， 通 过 new 可 以 创建 类 的 实例 。Python 的 方式 更 加 简单 。 
一 旦 定义 了 一 个 类 ， 创建 实例 比 调用 一 个 函数 还 容易 一 一 一 不 费 吹 灰 之 力 。 实 例 化 的 实现 ， 可 以 使 
HI RIETI, UD Ras: 











>» class MyClass (object):  # define class EX 
pass 
2» mc = MyClass O # instantiate class HZZ 





可 以 看 到 ， 仪 调用 (“calling”) 类 :MyClass ()， 就 创建 了 类 MyClass 的 实例 mc. JN RAK 
所 调用 类 的 一 个 实例 。 当 使 用 函数 记 法 来 调用 (“call1”) 一 个 类 时 ， 解 释 器 就 会 实例 化 该 对 象 ， 并 且 
调用 Python 所 拥有 与 构造 函数 最 相近 的 东西 (如果 你 定义 了 的 话 ) 来 执行 最 终 的 定制 工作 , 比如 设置 
实例 属性 , 最 后 将 这 个 实例 返回 给 你 。 




















核心 笔记 : Python2. 2 前 后 的 类 和 实例 
类 和 类 型 在 2.2 版 本 中 就 统一 了 ， 这 使 得 Python 的 行为 更 像 其 它 面向 对 象 编程 语言 。 任 何 类 或 
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者 类 型 的 实例 都 是 这 种 类 型 的 对 象 。 比 如 ， 如 果 你 让 Python 告诉 你 ， 类 MyClass 的 实例 mc 是 否 是 
类 MyClass 的 一 个 实例 。 回 答 是 肯定 的 ，Python 不 会 说 谎 。 同 样 ， 它 会 告诉 你 零 是 integer 类 型 的 

2» mc = MyClass Q 

22^» type (mc) 

<class ' main .MyClass'^ 

22^ type (0) 

«type 'int/^ 

但 如 果 你 仔细 看 ， 比 较 MyClass 和 int， 你 将 会 发 现 二 者 都 是 类 型 (type) : 

>>> type (MyClass) 

<type ’ type’ > 

>>> type (int) 

<type ' type’ > 

对 比 一 下 ， 如 果 在 Python BF 2.2 版 本 时 ， 使 用 经 典 类 ， 此 时 类 是 类 对 象 ， 实 例 是 实例 对 象 。 
在 这 两 个 对 象 类 型 之 间 没 有 任何 关系 , 除了 实例 的 _class_ 属性 引用 了 被 实例 化 以 得 到 该 实例 的 类 。 
把 MyClass 在 Python2. 1 版 本 中 作为 经 典 类 重新 定义 ， 并 运行 相同 的 调用 (注意 : int O 那 时 还 不 具 
备 工厂 功能 . . . 它 还 仅 是 一 个 通常 的 内 建 函 数 ): 

>>> type (mc) 

<type ° instance’ > 


>>> type (0) 
<type ’ int > 
>>> 


>>> type (MyClass) 

<type ’class’ > 

>>> type (int) 

<type ’ builtin function or method > 

为 了 避免 任何 混淆 ， 你 只 要 记 住 当 你 定义 一 个 类 时 ， 你 并 没有 创建 一 个 新 的 类 型 ， 而 是 仅仅 一 
个 类 对 象 ， 而 对 2.2 及 后 续 版 本 ， 当 你 定义 一 个 〈 新 式 的 ) 类 后 ， 你 已 创建 了 一 个 新 的 类 型 。 


13.5.2 init O “构造 器 “方法 





当 类 被 调用 ， 实 例 化 的 第 一 步 是 创建 实例 对 象 。 一 旦 对 象 创建 了 ，Python 检查 是 否 实现 了 
init OÐ. RWE TF, MRA EXN (REM) 特殊 方法 init QO， 对 实例 不 会 施加 任 
何 特别 的 操作 . 任何 所 需 的 特定 操作 ， 都 需要 程序 员 实现 _init _()， 履 盖 它 的 默认 行为 。 如 果 
init 0 没有 实现 ， 则 返回 它 的 对 象 ， 实 例 化 过 程 完毕 。 



































然而 ， 如 果 _init 0 已 经 被 实现 ， 那 么 它 将 被 调用 ， 实 例 对 象 作 为 第 一 个 参数 (self) 被 传递 
进去 ， 像 标准 方法 调用 一 样 。 调 用 类 时 ， 传 进 的 任何 参数 都 交 给 了 init QO。 实际 中 ， 你 可 以 想 
像 成 这 样 : 把 创建 实例 的 调用 当成 是 对 构造 器 的 调用 。 
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BZ, (a) 你 没有 通过 调用 new 来 创建 实例 ， 你 也 没有 定义 一 个 构造 器 。 是 Python 为 你 创建 了 
WR; (b) init. (0 ， 是 在 解释 器 为 你 创建 一 个 实例 后 调用 的 第 一 个 方法 ， 在 你 开始 使 用 它 之 前 ， 
这 一 步 可 以 让 你 做 些 准备 工作 。 



































init (是 很 多 为 类 定义 的 特殊 方法 之 一 。 其 中 一 些 特殊 方法 是 预定 义 的 ， 缺 省 情况 下 ， 不 
进行 任何 操作 ， 比 如 _init (0 ， 要 定制 ， 就 必须 对 它 进行 重 载 ， 还 有 些 方法 ， 可 能 要 按 需 要 去 实 
现 。 本 章 中 ， 我 们 会 讲 到 很 多 这 样 的 特殊 方法 。 你 将 会 经 常 看 到 _init 0 的 使 用 ， 在 此 ， 就 不 举 
例 说 明了 。 





























13.5.3 . new 0 “构造 器 ”方法 





tj init 0 相 比 ， new OO 方法 更 像 一 个 真正 的 构造 器 。 类 型 和 类 在 版 本 2.2 就 统一 了 ， 
Python 用 户 可 以 对 内 建 类 型 进行 派生 ， 因 此 ， 需 要 一 种 途径 来 实例 化 不 可 变 对 象 ， 比 如 ， 派 生字 符 


MAP. iS As Fe 
P, Mf, SS. 











FER OL T. ARR a USA new 方法， 一 个 静态 方法 ， 并 且 传 入 的 参数 是 在 类 实例 
化 操作 时 生成 的 。 new_ 0 会 调用 父 类 的 _new 0 来 创建 对 象 ( 向 上 代理 )。 














为 何 我 们 认为 _new OH init (更 像 构 造 器 呢 ? 这 是 因为 _new O0 必须 返回 一 个 合法 
的 实例 , 这样 解 释 器 在 调用 _init (时 ,就 可 以 把 这 个 实例 作为 self 传 给 它 ,调用 父 类 的 _new_0 
来 创建 对 象 ， 正 像 其 它 语 言 中 使 用 new 关键 字 一 样 。 











new ORI init 0 在 类 创建 时 ， 都 传 入 了 《相同 〉 参 数 。13. 11. 3 节 中 有 个 例子 使 用 了 


new ()。 








13.5.4 del O “解构 器 “方法 





同样 ， 有 一 个 相应 的 特殊 解构 器 (destructor) 方法 名 为 “del _() 。 然 而 ， 由 于 Python 具有 
垃圾 对 象 回 收 机 制 ( 靠 引用 计数 )， 这 个 函数 要 直到 该 实例 对 象 所 有 的 引用 都 被 清除 掉 后 才 会 执行 。 
Python 中 的 解构 器 是 在 实例 释放 前 提供 特殊 处 理 功 能 的 方法 ， 它 们 通常 没有 被 实现 ， 因 为 实例 很 少 
被 显 式 释放 。 



































举例 


在 下 面 的 例子 中 ， 我 们 分 别 创建 GA) init 0 和 del 0 〇 构造 及 解构 函数 ， 然 后 ， 初 
始 化 类 并 给 同样 的 对 象 分 配 很 多 别名 。id0 内 建 函 数 可 用 来 确定 引用 同一 对 象 的 三 个 别名 。 最 后 一 
步 是 使 用 del 语句 清除 所 有 的 别名 ， 显 示 何 时 ， 调 用 了 多 少 次 解构 器 。 
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class C(P): # class declaration BY 
def init (self): # “constructor” UGE 
print 'initialized' 
def del (self): # “destructor” fff 
P. del (self) # call parent destructor print 'deleted! WHAK ZREJE H EU 
'deleted' 


> cl = CQO # instantiation initialized SEPPIA 

222 c2 = cl # create additional alias ÉW& i4 — f AE 

25» c3 = cl f create a third alias GJÆR — d AE 

2» id(cl), id(cZ), id(c3)  # all refer to same object J- RHA 3A 

(119389912, 11938912, 11938912) 

>>> del cl # remove one reference jAhRK-T4//4 

2» del c2 # remove another reference BRA -FNA 

>>> del c3 # remove final reference deleted # destructor finally invoked EJAS Ec 


Iit 











注意 ， 在 上 面 的 例子 中 ， 解 构 器 是 在 类 C 实例 所 有 的 引用 都 被 清除 掉 后 ， 才 被 调用 的 ， 比 如 ， 
当 引 用 计数 已 减少 到 0。 如 果 你 预期 你 的 _del 0 方法 会 被 调用 , 却 实际 上 没有 被 调用 , 这 意味 着 ， 











你 的 实例 对 象 由 于 某 些 原因 ， 其 引用 计数 不 为 0， 这 可 能 有 别 的 对 它 的 引用 ， 而 你 并 不 知道 这 些 让 
你 的 对 象 还 活着 的 引用 所 在 。 








` 


另外 ， 要 注意 ， 解 构 器 只 能 被 调用 一 次 ， 一 旦 引用 计数 为 0， 则 对 象 就 被 清除 了 。 这 非常 合理 
因为 系统 中 任何 对 象 都 只 被 分 配 及 解构 一 次 。 





M pk, 








e 不 要 起 记 首 先 调 用 父 类 的 _ del OO. 
e 调用 del x 不 表示 调用 了 x._del O 一 一 前 面 也 看 到 ， 它 仅仅 是 减少 x 的 引用 计数 。 
e 如 果 你 有 一 个 循环 引用 或 其 它 的 原因 ， 让 一 个 实例 的 引用 喜 留 不 去 ， 该 对 象 的 _del 0 可 








能 永远 不 会 被 执行 。 
e del_() 未 捕获 的 异常 会 被 忽略 掉 (因为 一 些 在 _del _() 用 到 的 变量 或 许 已 经 被 删除 了 )。 
FEE del _() 中 干 与 实例 没 任何 关系 的 事情 。 
e ”除非 你 知道 你 正在 干什么 ， 否 则 不 要 去 实现 _del O. 
e 如 果 你 定义 了 _del ， 并 且 实 例 是 某 个 循环 的 一 部 分 ， 垃 圾 回收 器 将 不 会 终止 这 个 循环 一 
一 你 需要 自己 显 式 调用 del. 




















核心 笔记 : 跟踪 实例 
Python 没有 提供 任何 内 部 机 制 来 跟踪 一 个 类 有 多 少 个 实例 被 创建 了 ， 或 者 记录 这 些 实例 是 些 什 
么 东西 。 如 果 需 要 这 些 功 能 ， 你 可 以 显 式 加 入 一 些 代码 到 类 定义 或 者 _init OU del 0 中 去 。 
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最 好 的 方式 是 使 用 一 个 静态 成 员 来 记录 实例 的 个 数 。 靠 保存 它们 的 引用 来 跟踪 实例 对 象 是 很 危险 的 ， 
因为 你 必须 合理 管理 这 些 引用 ， 不 然 ， 你 的 引用 可 能 没 办 法 释放 《〈 因 为 还 有 其 它 的 引用 )! 看 下 面 一 
个 例子 : 

class InstCt (object): 

count = 0 # count is class attr count 44 — f 2E i tE 


def init (self): # increment count ý count 
InstCt. count += 1 


def del (self): # decrement count J&Z count 
InstCt. count -= 


def howMany (self): # return count 次 /5 count 
return InstCt. count 


2» a = InstTrack () 
2» b = InstTrack () 
222 b. howMany () 

2 

222 a. howMany () 

2 

222 del b 

222 a. howMany () 

1 

2» del a 


22^ InstTrack. count 
0 


13. 6 实例 属性 











实例 仅 拥有 数据 属性 〈 方 法 严格 来 说 是 类 属性 )， 后 者 只 是 与 某 个 类 的 实例 相关 联 的 数据 值 ， 并 
且 可 以 通过 句点 属性 标识 法 来 访问 。 这 些 值 独立 于 其 它 实例 或 类 。 当 一 个 实例 被 释放 后 ， 它 的 属性 
同时 也 被 清除 了 。 


























13. 6.1 “实例 化 ”实例 属性 〈 或 创建 一 个 更 好 的 构造 器 ) 





设置 实例 的 属性 可 以 在 实例 创建 后 任意 时 间 进 行 ， 也 可 以 在 能 够 访问 实例 的 代码 中 进行 。 构 造 
器 init) 是 设置 这 些 属性 的 关键 点 之 一 。 
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核心 笔记 实例 属性 

能 够 在 “运行 时 ”创建 实例 属性 ， 是 Python 类 的 优秀 特性 之 一 ， 从 C++ 或 Java 转 过 来 的 人 会 被 
小 小 的 震惊 一 下 ， 因 为 C++ 或 Java 中 所 有 属性 在 使 用 前 都 必须 明确 定义 /声明 。 

Python 不 仪 是 动态 类 型 ， 而 且 在 运行 时 ， 人 允许 这 些 对 象 属性 的 动态 创建 。 这 种 特性 让 人 爱 不 释 
手 。 当 然 ， 我 们 必须 提醒 读者 ， 创 建 这 样 的 属性 时 ， 必 须 谨慎 。 

一 个 缺陷 是 ， 属 性 在 条 件 语 句 中 创建 ， 如 果 该 条 件 语句 块 并 未 被 执行 ， 属 性 也 就 不 存在 ， 而 你 
在 后 面 的 代码 中 试 着 去 访问 这 些 属性 ， 就 会 有 错误 发 生 。 故 事 的 精髓 是 告诉 我 们 ，Python 让 你 体验 
从 未 用 过 的 特性 ， 但 如 果 你 使 用 它 了 ， 你 还 是 要 小 心 为 好 。 





在 构造 器 中 首先 设置 实例 属性 

构造 器 是 最 早 可 以 设置 实例 属性 的 地 方 ， 因 为 ”init 0 是 实例 创建 后 第 一 个 被 调用 的 方法 。 
再 没有 比 这 更 早 的 可 以 设置 实例 属性 的 机 会 了 。 一 旦 _init 0 执行 完毕 ， 返 回 实例 对 象 ， 即 完成 
了 实例 化 过 程 。 

















默认 参数 提供 默认 的 实例 安装 

在 实际 应 用 中 ， 带 默认 参数 的 _init 0 提供 一 个 有 效 的 方式 来 初始 化 实例 。 在 很 多 情况 下 ， 
默认 值 表 示 设 置 实例 属性 的 最 常见 的 情况 , 如 果 提 供 了 默认 值 , 我 们 就 没 必 要 显 式 给 构造 器 传 值 了 。 
我 们 在 11.5.2 节 中 也 提 到 默认 参数 的 常见 好 处 。 需 要 明白 一 点 ， 默 认 参 数 应 当 是 不 变 的 对 象 ， 像 
列表 (list) 和 字典 (dictionary) 这 样 的 可 变 对 象 可 以 扮演 静态 数据 ， 然 后 在 每 个 方法 调用 中 来 维护 


它们 的 内 容 。 

























































































例 13.1 描述 了 如 何 使 用 默认 构造 器 行为 来 帮助 我 们 计算 在 美国 一 些 大 都 市 中 的 旅馆 中 寄宿 时 ， 
租房 总 费用 。 








代码 的 主要 目的 是 来 帮助 茶 人 计算 出 每 日 旅馆 租房 费用 ， 包 括 所 有 州 销售 税 和 房 税 。 缺 省 为 旧 
金山 附近 的 普通 区 域 ， 它 有 8. 5% 销 售 税 及 10% 的 房间 税 。 每 日 租房 费用 没有 缺 省 值 ， 因 此 在 任何 实 
例 被 创建 时 ， 都 需要 这 个 参数 。 























例 13. 1 使 用 缺 省 参数 进行 实例 化 
(hotel. py) 





定义 一 个 类 来 计算 这 个 假想 旅馆 租房 费用 。 init 0 构造 器 对 一 些 实例 属性 进行 初始 化 。 
calcTotal 0 〇 方法 用 来 决定 是 计算 每 日 总 的 租房 费用 还 是 计算 所 有 天 全 部 的 租房 费 。 

1 class HotelRoomCalc (object): 

2’Hotel room rate calculator’ 


d 
4def | init (self, rt, sales=0. 085, rm=0. 1): 
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5 HotelRoomCalc default arguments: 
6sales tax == 8.5% and room tax == 10% 


7self. salesTax = sales 





pa 


Sself. roomlax = rm 

9self. roomkate = rt 

10 

77 def calcTotal (self, days=1): 

12  'Calculate total; default to daily rate’ 

13 daily = round((self. roomRate *14 (1 + self. roomTax + self. salesTax)), 2) 
15 return float (days) * daily 





设置 工作 是 由 _ init 0 在 实例 化 之 后 完成 的 ， 如 上 第 4 到 8 行 ， 其 余部 分 的 核心 代码 是 
calcTotal 0 方法， 从 第 10 到 14 行 。 init. 0 的 工作 即 是 设置 一 些 参数 值 来 决定 旅馆 总 的 基本 租 
房 费 用 《〈 不 包括 住房 服务 ， 电 话费 ， 或 其 它 偶发 事情 )。calcTotal 0 可 以 计算 每 日 所 有 费用 ， 如 果 
提供 了 天 数 ， 那 么 将 计算 整个 旅程 全 部 的 住宿 费用 。 内 建 的 round O 函数 可 以 大 约 计算 出 最 接近 的 费 
用 《两 个 小 数位 )。 下 面 是 这 个 类 的 用 法 : 

















>>> sfo = HotelRoomCalc (299) # new instance PISE 

>>> sfo.calcTotal() # daily rate HT 

364. 32 

222 sfo. calcTotal(Z) # 2-day rate 2 KI fld 

/08. 64 
22» sea = HotelRoomCalc (189, 0. 086, 0.058) # new instance JHJE pa 
225» sea. calcTotal () 
216. 22 
225» sea. calcTotal (4) 
864. 88 
22» wasWkDay = HotelRoomClalc (169, 0.045, 0.02) # new instance J3tffl 
22» wasWkEnd = HotelRoomCalc (119, 0. 045, 0.02) # new instance J/3tffl 
22» wasWkDay. calcTotal (5) + wasWkEnd. calcTotal() # 7-day rate 7 XI flle 
1026. 69 





最 开始 的 两 个 假想 例子 都 是 在 旧金山 (San Francisco), 使 用 了 默认 值 ， 然 后 是 在 西雅图 
(Seattle), ， 这 里 我 们 提供 了 不 同 的 销售 税 和 房间 税率 。 最 后 一 个 例子 在 华盛顿 特区 
(Washington. D.C)。 经 过 计算 更 长 的 假想 时 间 ， 来 扩展 通常 的 用 法 : 停留 五 个 工作 日 ， 外 加 一 个 周 
六 ， 此 时 有 特价 ， 假 定 是 星期 天 出 发 回 家 。 









































不 要 和 忘记， 函数 所 有 的 灵活 性 ， 比 如 默认 参数 ， 也 可 以 应 用 到 方法 中 去 。 在 实例 化 时 ， 可 变 长 
度 参 数 也 是 一 个 好 的 特性 (当然 ， 这 要 根据 应 用 的 需要 ) 














$— 一 * 一 
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. init (应 当 返 回 None 

你 也 知道 ， 采 用 函数 操作 符 调 用 类 对 象 会 创建 一 个 类 实例 ， 也 就 是 说 这 样 一 种 调用 过 程 返 回 的 
对 象 就 是 实例 ， 下 面 示例 可 以 看 出 : 

22» class MyClass (object): 

pass 

22» mc = MyClass 0 

222 mc 

€ main .MyClass instance at 95d390» 











如 果 定 义 了 构造 器 ， 它 不 应 当 返 回 任何 对 象 ， 因 为 实例 对 象 是 自动 在 实例 化 调用 后 返回 的 。 is 
WB, — init (0 就 不 应 当 返 回 任何 对 象 〈 应 当 为 None); 否则 ， 就 可 能 出 现 冲 突 ， 因 为 只 能 返回 
例 。 试 着 返回 非 None 的 任何 其 它 对 象 都 会 导致 TypeError 异常 : 
>>> class MyClass: 
def init (self): 
print 'initialized' 








return 1 


2» mc = MyClass Q 

initialized 

Traceback (innermost last): File “<stdin>”, line l, in ? 
mc = MyClass 0 


TypeError: | init ( should return None 


13. 6. 2 查看 实例 属性 











内 建 函 数 dir O 可 以 显示 类 属性 ， 同 样 还 可 以 打印 所 有 实例 属性 ; 
22^ class C(object): 








... pass 

Dec =CO 

2> c. foo = roger’ 
2» c. bar = ’shrubber’ 
2 dir (c) 

[. class '", ' delattr '", ' dict ’, ' doc 
| getattribute ', ' hash’, ' init 


3 3 


E E td P4 E 3 
new, reduce ^, __reduce_ex_, repr, 


P 
^ 








', ” Qodule ^, 











了 2 P 


__setattr_’, str ', ' weakref °, bar’, 'foo'] 





与 类 相似 ， o QUNM 《可 以 调用 vars O 并 传 入 一 个 实例 来 获取 )， 它 是 实 
例 属 性 构成 的 一 个 字典 


E 











$— 一 * 一 
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222 c. dict . 
(lfoo': 'roger', 'bar': 'shrubber'] 





13. 6. 3 特殊 的 实例 属性 


实例 仅 有 两 个 特殊 属性 〈 见 表 13.2)。 对 于 任意 对 象 I: 








表 13. 2 特殊 实例 属性 





I. class | 实例 化 I 的 类 
IL dict - I 的 属性 





现在 使 用 类 C 及 其 实例 C 来 看 看 这 些 特殊 实例 属性 : 


HE 











2» class C(object): # define class iE X26 


pass 


2> c = CO # create instance JÆ 

2» dir(c)  # instance has no attributes ZØ ZAJETE 
ig 

>> c. dict #4 yep, definitely no attributes WAJ HE 
0 
» c class_# class that instantiated us  SEfAME c H 
<class ' main . C> 











你 可 以 看 到 ,cc 现在 还 没有 数据 属性 ， 但 我 们 可 以 添加 一 些 再 来 检查 _dict 属性 ， 看 是 否 添 加 
成 功 了 : 

D>» c. foo = 1 

222 c. bar = 'SPAM' 

2> °%d can of %s please’ % (c. foo, c. bar) 

“7 can of SPAM please’ 

222 c. dict __ 

{’ foo’: 1, Dar 'SPAM } 








- dict 属性 由 一 个 字典 组 成 ， 包 含 一 个 实例 的 所 有 属性 。 键 是 属性 名 ， 值 是 属性 相应 的 数据 
值 。 字 典 中 仅 有 实例 属性 ， 没 有 类 属性 或 特殊 属性 。 























—= 

















核心 风格 : AECL dict 
对 类 和 实例 来 说 ， 尽 管 _dict 属性 是 可 修改 的 ， 但 还 是 建议 你 不 要 修改 这 些 字典 ， 除 非 你 知 
道 你 的 目的 。 这些 修改 可 能 会 破坏 你 的 00P， 造 成 不 可 预料 的 副作用 。 使 用 熟悉 的 句点 属性 标识 来 访 


E 





$— —$— 
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问 及 操作 属性 会 更 易于 接受 。 需 要 你 直接 修改 _dict_ 属性 的 情况 很 少 ， 其 中 之 一 是 你 要 重 载 
_ setattr 特殊 方法 。 实现 _setattr OQ 本身 是 一 个 冒险 的 经 历 ， 满 是 圈套 和 陷阱 ， 例 如 无 穷 递 
归 和 破坏 实例 对 象 。 这 个 故事 还 是 留 到 下 次 说 吧 。 











13. 6. 4 内 建 类 型 属性 











内 建 类 型 也 是 类 ， 它 们 有 没有 像 类 一 样 的 属性 呢 ? 那 实例 有 没有 呢 ? 对 内 建 类 型 也 可 以 使 用 
dirO， 与 任何 其 它 对 象 一 样 ， 可 以 得 到 一 个 包含 它 属性 名 字 的 列表 : 
222^ x = 3+0. 147 


























22x class _ 

«type ° complex’ > 

2 dir (x) 

[. abs '", ' add '", ' class ’, ' coerce ， 


了 





| delattr ', ' div ', ' divmod ’, ' doc ^", ' eq ， 








” float ', ' floordiv ', ' ge ’, ' getattribute ', 





^ getnewargs ’°, ' gt ’°, ' hash ', ' init’, 





"o Amt C, " de CQ " done ^", ` dt '", * mod ”’, 





ei 3 Pd 2 ri 


3 I 3 I 
mul , ne, neg, new, nonzero, 





' pos’, ' pow’, ` radd ’, ' rdiv_’, ' rdivmod ^, 





' reduce ^", ' reduce ex ^", ' repr’, ' rfloordiv ^, 





rmod °’, ' rmul /', ' rpow ^", ' rsub /', 





了 I P4 了 2 


^ rtruediv ^', ' setattr ', str; sub ^, 





” truediv ^', 'conjugate', ’ imag’, 'real'/ 

P2», 

2» [type(getattr(x, i)) for i in ( conjugate’, ’ imag’, 
"real 

[<type 'builtin function or method ^, «type ’ float’), 
«type 'float'»] 





既然 我 们 知道 了 一 个 复数 有 什么 样 的 属性 ， 我 们 就 可 以 访问 它 的 数据 属性 ， 调 用 它 的 方法 了 : 
222 x. imag 

2.0 

222 x. real 

1.0 

22^» x. conjugate () 

(1-25) 

















wi dict 会 失败， 因为 在 内 建 类 型 中 ， 不 存在 这 个 属性 : 
>>> x. dict . 
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Traceback (innermost last): File ^X«stdim^^, line 1, in ? 
AttributeError: | dict . 


Bui 


13.6.5 实例 属性 vs 类 属性 











我 们 已 在 13. 4. 1 节 中 描述 了 类 数据 属性 。 这 里 简要 提 一 下 ， 类 属性 仅 是 与 类 相关 的 数据 值 ， 和 
实例 属性 不 同 ， 类 属性 和 实例 无 关 。 这 些 值 像 静态 成 员 那 样 被 引用 ， 即 使 在 多 次 实例 化 中 调用 类 ， 
它们 的 值 都 保持 不 变 。 不 管 如 何 ， 静 态 成 员 不 会 因为 实例 而 改变 它们 的 值 ， 除 非 实例 中 显 式 改 变 它 
们 的 值 。( 实 例 属性 与 类 属性 的 比较 ， 类 似 于 自动 变量 和 静态 变量 ， 但 这 只 是 笼统 的 类 推 。 在 你 对 自 
动 变量 和 静态 变量 还 不 是 很 熟 的 情况 下 ， 不 要 深究 这 些 。 
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一 :一 


类 和 实例 都 是 名 字 空 间 。 类 是 类 属性 的 名 字 空 间 ， 实 例 则 是 实例 属性 的 。 











关于 类 属性 和 实例 属性 ， 还 有 一 些 方面 需要 指出 。 你 可 采用 类 来 访问 类 属性 ， 如 果实 例 没 有 同 
名 的 属性 的 话 ， 你 也 可 以 用 实例 来 访问 。 














访问 类 属性 








类 属性 可 通过 类 或 实例 来 访问 。 下 面 的 示例 中 ， 类 C 在 创建 时 ， 带 一 个 version 属性 ， 这 样 通 
过 类 对 象 来 访问 它 是 很 自然 的 了 ， 比 如 ，C. version。 当 实例 c 被 创建 后 ， 对 实例 c mim. ui 
c. version 会 失败 ， 不 过 Python 首先 会 在 实例 中 搜索 名 字 version， 然 后 是 类 ， 再 就 是 继承 树 中 的 
FER. AIH, version 在 类 中 被 找到 了 : 
22» class C(object): # define class jE X28 
version = 1.2 # static member  ÉFEZ IH 














> c = CO # instantiation SHG 
2» C. version # access via class AD ZEXeyrpul 


1.2 
> c. version # access via instance LEJE H 
1.2 


2» C version += (L1 # update (only) via class U4 (NECK) KEW 
2» C version # class access #W/H 

L. 3 

2» c. version # instance access, which  SEfflHE. AH CRR 

1.3 # also reflected change 





然而 ， 我 们 只 有 当 使 用 类 引用 version 时 ， 才 能 更 新 它 的 值 ， 像 上 面 的 C. version 递增 语句 。 
性 
性 








如 果 尝 试 在 实例 中 设 定 或 更 新 类 属性 会 创建 一 个 实例 属性 c. version， 后 者 会 阻止 对 类 属 : 
C.versioin 的 访问 ， 因 为 第 一 个 访问 的 就 是 c. version， 这 样 可 以 对 实例 有 效 地 “遮蔽 ”类 属 ! 




















E 
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C. version, HFI c. version 被 清除 掉 。 





从 实例 中 访问 类 属性 须 谨慎 





与 通常 Python 变量 一 样 ， 任 何 对 实例 属性 的 赋值 都 会 创建 一 个 实例 属性 〈 如 果 不 存 在 的 话 ) 并 
且 对 其 赋值 。 如 果 类 属性 中 存在 同名 的 属性 ， 有 趣 的 副作用 即 产生 。( 经 典 类 和 新 式 类 都 存在 ) 




















222 class Foo(object): 
x-165 


2» foo = Foo() 

222 foo. X 

‘a 

22» foo. x = 1. 7# try to update class attr BUE ÆW ZJE HE 
2» foo.x # looks good so far... MÉARA A 


1.7 
2» Foox # nope, just created a new inst attr Mi, RAE RÆCIEÆ S e 
PUG TE 
1.5 

















$ 在 上 面 的 代码 片断 中 ， 创 建 了 一 个 名 为 version 的 新 实例 属性 ， 它 覆盖 了 对 类 属性 的 引用 。 然 E 
而 ， 类 属性 本 身 并 没有 受到 伤害 ， 仍 然 存在 于 类 域 中 ， 还 可 以 通过 类 属性 来 访问 它 ， 如 上 例 可 以 看 
到 的 。 好 了 ， 那 么 如 果 把 这 个 新 的 version 删除 掉 ， 会 怎么 样 呢 ? 为 了 找到 结论 ， 我 们 将 使 用 del 
语句 删除 c. version。 
2» del foo.x # delete instance attribute HREH TE 
2 foo.x # can now access class attr again KAW AAS HE 
1.5 
































所 以 ， 给 一 个 与 类 属性 同名 的 实例 属性 赋值 ， 我 们 会 有 效 地 “隐藏 ”类 属性 ， 但 一 旦 我 们 删除 






































了 这 个 实例 属性 ， 类 属性 又 重见天日 。 现 在 再 来 试 着 更 新 类 属性 ， 但 这 次 ,我们 只 尝试 一 下 “无 认 ” 
的 增 量 动作 : 

222 foo.x += .2# try to increment class attr WA LŽ IZ i HE 

222 foo. X 

l7 

2» Foo.x # nope, same thing Mi, HAIA 

1.5 














还 是 没 变 。 我 们 同样 创建 了 一 个 新 的 实例 属性 ， 类 属性 原封 不 动 。( 深 入 理解 Python 相关 知识 : 
属性 已 存 于 类 字典 [_dict_] 中 。 通 过 赋值 ， 其 被 加 入 到 实例 的 _dict_ 中 了 。) 赋值 语句 右边 的 表 
达 式 计算 出 原 类 的 变量 ， 增 加 0. 2， 并 且 把 这 个 值 赋 给 新 创建 的 实例 属性 。 注 意 下 面 是 一 个 等 价 的 赋 
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值 方式 ， 但 它 可 能 更 加 清楚 些 : 





Too. x = Foo. *0.2 


(B... 在 类 属性 可 变 的 情况 下 ， 一 切 都 不 同 了 : 
22» class Foo (object): 
x = (2003: 'poe2'] 








2» foo = Foo() 
222 foo. X 

(2003: 'poeZ2'] 
22» foo. x[2004] = 'valid path’ 
222 foo. X 

{2003: 'poe2/', 2004: 'valid path'j 
>>» Foo.x # it works!!! ÆI 

(2003: 'poe2/', 2004: 'valid path’} 
>> del foo.x # no shadow so cannot delete IC ACHT UT PERHE 
Traceback (most recent call last): File “<stdin>”, line 1, in ? 
del foo. x 

AttributeError: x 

225 


类 属性 持久 性 








静态 成 员 ， 如 其 名 所 言 ， 任 赁 整个 实例 〈 及 其 属性 ) 的 如 何 进展 ， 它 都 不 理 不 采 《〈 因 此 独立 于 
实例 )。 同 时 ， 当 一 个 实例 在 类 属性 被 修改 后 才 人 创建， 那么 更 新 的 值 就 将 生效 。 类 属性 的 修改 会 影响 
到 所 有 的 实例 : 

22^ class C(object): 

spam = 100# class attribute ŠJ E 























S»> cl =CQO # create an instance Él£& —f SEfij 

22» cl. spam # access class attr thru inst. Wn IA HE 
100 

2» C spam += 100 £ update class attribute HAS 

>> C. spam # see change in attribute BA/BIFAKE 





200 
222 cl. spam # confirm change in attribute EZH P A UL B IH BEC 
200 


9» c2 =CO  # create another instance GY#A-TEA 
222 c2. spam # verify class attribute urZ BE 
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200 

> del cl # remove one instance fÜE&—-fSCffl 

> C spam += 200 # update class attribute again AKEH AJETE 
222 c2. spam # verify that attribute changed JL fia 
400 


核心 提示 : 使 用 类 属性 来 修改 自身 〈 不 是 实例 属性 ) 

正如 上 面 所 看 到 的 那样 ， 使 用 实例 属性 来 试 着 修改 类 属性 是 很 危险 的 。 原 因 在 于 实例 拥有 它们 
自己 的 属性 集 ， 在 Python 中 没有 明确 的 方法 来 指示 你 想 要 修改 同名 的 类 属性 ， 比 如 ， 没 有 global 
关键 字 可 以 用 来 在 一 个 函数 中 设置 一 个 全 局 变量 〈 来 代替 同名 的 局 部 变量 )。 修 改 类 属性 需要 使 用 类 
名 ， 而 不 是 实例 名 。 








13.7 从 这 里 开始 校对 一 一 一 一 一 绑 定 和 方法 调用 








现在 我 们 需要 再 次 阐述 Python PHE (binding) 的 概念 ， 它 主要 与 方法 调用 相关 连 。 我 们 先 
来 回顾 一 下 与 方法 相关 的 知识 。 首 先 ， 方 法 仅仅 是 类 内 部 定义 的 函数 。( 这 意味 着 方法 是 类 属性 而 不 
是 实例 属性 ) 。 









































其 次 ， 方 法 只 有 在 其 所 属 的 类 拥有 实例 时 ， 才 能 被 调用 。 当 存在 一 个 实例 时 ， 方 法 才 被 认为 是 
绑 定 到 那个 实例 了 。 没 有 实例 时 方法 就 是 未 绑 定 的 。 
































最 后 ， 任 何 一 个 方法 定义 中 的 第 一 个 参数 都 是 变量 self， 它 表示 调用 此 方法 的 实例 对 象 。 





核心 笔记 : self 是 什么 ? 

self 变量 用 于 在 类 实例 方法 中 引用 方法 所 绑 定 的 实例 。 因 为 方法 的 实例 在 任何 方法 调用 中 总 是 
作为 第 一 个 参数 传递 的 ，self 被 选中 用 来 代表 实例 。 你 必须 在 方法 声明 中 放 上 self (你 可 能 已 经 注 
意 到 了 这 点 ), 但 可 以 在 方法 中 不 使 用 实例 (self) 。 如 果 你 的 方法 中 没有 用 到 self ， 那 么 请 考虑 创建 
一 个 常规 函数 ， 除 非 你 有 特别 的 原因 。 上 毕竟 ， 你 的 方法 代码 没有 使 用 实例 ， 没 有 与 类 关联 其 功能 ， 
这 使 得 它 看 起 来 更 像 一 个 常规 函数 。 在 其 它 面向 对 象 语 言 中 ，self 可 能 被 称 为 this。 


13. 7. 1 调用 绑 定 方法 








方法 ， 不 管 绑 定 与 否 ， 都 是 由 相同 的 代码 组 成 的 。 唯 一 的 不 同 在 于 是 否 存在 一 个 实例 可 以 调用 
此 方法 。 在 很 多 情况 下 ， 程 序 员 调用 的 都 是 一 个 绑 定 的 方法 。 假 定 现在 有 一 个 MyClass 类 和 此 类 的 
一 个 实例 mc， 而 你 想 调用 MyClass. foo O 方法。 因为 已 经 有 一 个 实例 ， 你 只 需要 调用 mc. foo O 就 可 
以 。 记 得 self 在 每 一 个 方法 声明 中 都 是 作为 第 一 个 参数 传递 的 。 当 你 在 实例 中 调用 一 个 绑 定 的 方法 
时 ，self 不 需要 明确 地 传 入 了 。 这 算是 “必须 声明 self 作为 第 一 个 参数 “对 你 的 报酬 。 当 你 还 没有 
一 个 实例 并 且 需 要 调用 一 个 非 绑 定 方 法 的 时 候 你 必须 传递 self BAL. 
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13. 7. 2 调用 非 绑 定 方法 





























调用 非 绑 定 方法 并 不 经 常用 到 。 需 要 调用 一 个 还 没有 任何 实例 的 类 中 的 方法 的 一 个 主要 的 场景 
是 :你 在 派生 一 个 子 类 , 而 且 你 要 履 善 父 类 的 方法 ， 这 时 你 需要 调用 那个 父 类 中 想 要 履 盖 掉 的 构造 方 
法 。 这 里 是 一 个 本 章 前 面 介绍 过 的 例子 : 


























class EmplAddrBookEntry (AddrBookEntry) : 
'Employee Address Book Entry class’ # RK LIE A 
def init (self, nm, ph, em): 
AddrBookEntry. init (self, nm, ph) 
self. empid — id 
self. email = em 


EmplAddrBookEntry 是 AddrBookEntry 的 子 类 ,我 们 重 载 了 构造 器 ”init 0. 我们 想 尽 可 能 
地 重用 代码 ， 而 不 是 去 从 父 类 构造 器 中 剪 切 ， 粘 贴 代 码 。 这 样 做 还 可 以 避免 BUG 传播 ， 因 为 任何 修 
复 都 可 以 传递 给 子 类 。 这 正 是 我 们 想 要 的 没有 必要 一 行 一 行 地 复制 代码 。 只 需要 能 够 调用 父 类 
的 构造 器 即 可 ， 但 该 怎么 做 呢 ? 



































我 们 在 运行 时 没有 AddrBookEntry 的 实例 。 那 么 我 们 有 什么 呢 ? 我 们 有 一 个 Emp1AddrBookEntry . 
的 实例 ， 它 与 AddrBookEntry 是 那样 地 相似 ， 我 们 难道 不 能 用 它 代替 呢 ? 当然 可 以 ! 


当 一 个 EmplAddrBookEntry 被 实例 化 ， 并 且 调 用 init O 时， 其 与 AddrBookEntry 的 实例 
只 有 很 少 的 差别 ， 主 要 是 因为 我 们 还 没有 机 会 来 自 定义 我 们 的 EmplAddrBookEntry 实例 ， 以 使 它 与 
AddrBookEntry 不 同 。 



































这 是 调用 非 绑 定 方法 的 最 佳 地 方 了 。 我 们 将 在 子 类 构造 器 中 调用 父 类 的 构造 器 并 且 明 确 地 传递 
(LA) 构造 器 所 需要 的 self 参数 〈 因 为 我 们 没有 一 个 父 类 的 实例 )。 子 类 中 init O 的 第 一 
行 就 是 对 父 类 _init 0 的 调用 。 我 们 通过 父 类 名 来 调用 它 ， 并 且 传 递 给 它 self 和 其 他 所 需要 的 
参数 。 一 旦 调用 返回 ， 我 们 就 能 定义 那些 与 父 类 不 同 的 仅 存 在 我 们 的 〈 子 ) 类 中 的 《实例 ) 定制 。 














13.8 静态 方法 和 类 方法 


静态 方法 和 类 方法 在 Python2. 2 中 引入 。 经 典 类 及 新 式 new-style) 类 中 都 可 以 使 用 它 。 一 对 内 
建 函 数 被 引入 , 用 于 将 作为 类 定义 的 一 部 分 的 某 一 方法 声明 “标记 ” (tag),“ 强 制 类 型 转换 ” (cast) 
或 者 “转换 ”(convert) 为 这 两 种 类 型 的 方法 之 一 。 


























如 果 你 有 一 定 的 C++ 或 者 Java 经 验 ,静态 方法 和 这 些 语言 中 的 是 一 样 的 它们 仅 是 类 中 的 函数 (不 
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需要 实例 ) 。 事 实 上 ， 在 静态 方法 加 入 到 Python 之 前 ， 用 户 只 能 在 全 局 名 字 空 间 中 创建 函数 ， 作 为 
这 种 特性 的 替代 实现 - 有 时 在 这 样 的 函数 中 使 用 类 对 象 来 操作 类 (或 者 是 类 属性 )。 使 用 模块 函数 
比 使 用 静态 类 方法 更 加 常见 。 



































回忆 一 下 ， 通 常 的 方法 需要 一 个 实例 (sel) 作为 第 一 个 参数 ， 并 且 对 于 《〈 绑 定 的 ) 方法 调用 来 
ii, self 是 自动 传递 给 这 个 方法 的 。 而 对 于 类 方法 而 言 ， 需 要 类 而 不 是 实例 作为 第 一 个 参数 ， 它 是 
由 解释 器 传 给 方法 。 类 不 需要 特别 地 命名 ， 类 似 self， 不 过 很 多 人 使 用 cls 作为 变量 名 字 。 


























13.8.1 staticmethod () #1 classmethod () Pj Æ p Zi 

















现在 让 我 们 看 一 下 在 经 典 类 中 创建 静态 方法 和 类 方法 的 一 些 例子 (你 也 可 以 把 它们 用 在 新 式 类 
中 ): 
class TestStaticllethod: 
def foo(): 
print 'calling static method foo()’ 











foo = staticmethod (foo) 


class TestClassMethod: 
def foo(cls): 
print 'calling class method foo()’ 
print 'foo() is part of class:', cls. name . 


foo = classmethod (foo) 





对 应 的 内 建 函 数 被 转换 成 它们 相应 的 类 型 ， 并 且 重 新 赋值 给 了 相同 的 变量 名 。 如 果 没 有 调用 这 
两 个 函数 ， 二 者 都 会 在 Python 编译 器 中 产生 错误 ， 显 示 需 要 带 self 的 常规 方法 声明 。 现 在 ， 我 们 
可 以 通过 类 或 者 实例 调用 这 些 函 数 . . . . 这 没什么 不 同 : 

2» tsm = TestStaticMethod 0 

2^» TestStaticlfethod. foo () 

calling static method foo() 

2252 tsm. foo() 

calling static method foo() 

225 

2^» tem = TestClassMethod () 

>»» TestClassMethod. foo () 

calling class method foo () 

foo() is part of class: TestClassMethod 

252 tem. foo () 
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calling class method foo (Q) 
foo() is part of class: TestClassMethod 





13.8.2 使 用 函数 修饰 符 





现在 ， 看 到 像 foo=staticmethod (foo) 这样 的 代码 会 刺激 一 些 程 序 员 。 很 多 人 对 这 样 一 个 没 意 义 
的 语法 感到 心烦 ， 即 使 van Rossum 曾 指 出 过 ， 它 只 是 临时 的 ， 有 待 社区 对 些 语 义 进行 处 理 。 在 第 11 
章 “ 函 数 ” 的 11.3.6 节 中 ， 我 们 了 解 了 函数 修饰 符 ， 一 种 在 Python2. 4 中 加 入 的 新 特征 。 你 可 以 用 
它 把 一 个 函数 应 用 到 另 个 函数 对 象 上 ， 而 且 新 函数 对 象 依然 绑 定 在 原来 的 变量 。 我 们 正 是 需要 它 来 
整理 语法 。 通 过 使 用 decorators， 我 们 可 以 避免 像 上 面 那样 的 重新 赋值 : 




















class TestStaticMethod: 
@staticmethod 
def foo(): 
print ‘calling static method foo()’ 


class TestClassMethod: 


@classmethod 
def foo(cls): 
print 'calling class method foo()’ 
print 'foo() is part of class:', cls. name - 
13.9 A 





一 个 类 被 定义 后 ， 目 标 就 是 要 把 它 当 成 一 个 模块 来 使 用 ， 并 把 这 些 对 象 嵌 入 到 你 的 代码 中 去 ， 
同 其 它 数 据 类 型 及 逻辑 执行 流 混合 使 用 。 有 两 种 方法 可 以 在 你 的 代码 中 利用 类 。 第 一 种 是 组 合 
(composition)。 就 是 让 不 同 的 类 混合 并 加 入 到 其 它 类 中 ， 来 增加 功能 和 代码 重用 性 。 你 可 以 在 一 个 
大 点 的 类 中 创建 你 自己 的 类 的 实例 ， 实 现 一 些 其 它 属 性 和 方法 来 增强 对 原来 的 类 对 象 。 另 一 种 方法 
是 通过 派生 ， 我 们 将 在 下 一 节 中 讨论 它 . 



































举例 来 说 , 让 我 们 想象 一 个 对 本 章 一 开始 创建 的 地 址 本 类 的 加 强 性 设计 。 如 果 在 设计 的 过 程 中 ， 
为 names, addresses 等 等 创建 了 单独 的 类 。 那 么 最 后 我 们 可 能 想 把 这 些 工作 集成 到 AddrBookEntry 
类 中 去 ， 而 不 是 重新 设计 每 一 个 需要 的 类 。 这 样 就 节省 了 时 间 和 精力 ， 而 且 最 后 的 结果 是 容易 维护 
的 代码 -一 一 块 代码 中 的 bugs 被 修正 ， 将 反映 到 整个 应 用 中 。 























这 样 的 类 可 能 包含 一 个 Name 实例 ， 以 及 其 它 的 像 StreetAddress, Phone (home, work, 
telefacsimile，pager，mobile， 等 等 )，Email (home，work， 等 等 。) ， 还 可 能 需要 一 些 Date SE 


例 Cbirthday, wedding, anniversary, 等 等 )。 下 面 是 一 个 简单 的 例子 : 


E 














$— 一 * 一 
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class NewAddrBookEntry (object): # class definition ZEX 
'new address book entry class’ 
def | init (self, nm, ph): # define constructor € X fA as 
self. name = Name (nm) # create Name instance 6/€# Name Ef 
self. phone = Phone (œh) # create Phone instance #/€ Phone fi) 
print 'Created instance for:', self. name 


-+e 


NewAddrBookEntry 类 由 它 自身 和 其 它 类 组 合 而 成 。 这 就 在 一 个 类 和 其 它 组 成 类 之 间 定 义 了 一 种 
“has-a/ 有 一 个 ”的 关系 。 比 如 , 我 们 的 NewAddrBookEntry 类 “有 一 个 ”Name 类 实例 和 一 个 Phone 
实例 。 











T 


创建 复合 对 象 就 可 以 实现 这 些 附加 的 功能 ， 并 且 很 有 意义 ， 因 为 这 些 类 都 不 相同 。 每 一 个 类 管 
理 它们 自己 的 名 字 空 间 和 行为 。 不 过 当 对 象 之 间 有 更 接近 的 关系 时 ， 派 生 的 概念 可 能 对 你 的 应 用 程 
序 来 说 更 有 意义 ， 特 别 是 当 你 需要 一 些 相似 的 对 象 ， 但 却 有 少许 不 同 功能 的 时 候 。 























13.10 FMRE 








设计 “相同 的 类 但 有 一 些 不 同 的 功能 ”时 ， 派 生 就 是 一 个 更 加 合理 的 选择 了 。 








当 类 之 间 有 显著 的 不 同 ， 并 且 ( 较 小 的 类 ) 是 较 大 的 类 所 需要 的 组 件 时 ， 组 合 表现 得 很 好 ， 但 当 
你 


OOP 的 更 强大 方面 之 一 是 能 够 使 用 一 个 已 经 定义 好 的 类 ,扩展 它 或 者 对 其 进行 修改 ,而 不 会 影响 
系统 中 使 用 现存 类 的 其 它 代码 片段 。00D 允许 类 特征 在 子孙 类 或 子 类 中 进行 继承 ,这 些 子 类 从 基 类 (或 
称 祖先 类 ， 超 类 ) 继承 它们 的 核心 属性 。 而 且 ， 这 些 派生 可 能 会 扩展 到 多 代 。 在 一 个 层次 的 派生 关 
系 中 的 相关 类 (或 者 是 在 类 树 图 中 垂直 相 邻 是 父 类 和 子 类 关系 。 从 同一 个 父 类 派生 出 来 的 这 些 类 
(或 者 是 在 类 树 图 中 水 平 相 邻 是 同胞 关系 。 父 类 和 所 有 高 层 类 都 被 认为 是 祖先 。 




















使 用 前 一 节 中 的 例子 ， 如 果 我 们 必须 创建 不 同类 型 的 地 址 本 。 即 ， 不 仅仅 是 创建 地 址 本 的 多 个 
实例 ， 在 这 种 情况 下 ， 所 有 对 象 几乎 是 相同 的 。 如 果 我 们 希望 EmplAddrBookEntry 类 中 包含 更 多 与 
工作 有 关 的 属性 ， 如 员工 ID 和 e-mail 地 址 ? 这 跟 PersonalAddrBookEntry 类 不 同 ， 它 包含 更 多 基 
于 家 庭 的 信息 ， 比 如 家 庭 地 址 ， 关 系 ， 生 日 等 等 。 

















两 种 情况 下 ， 我 们 都 不 想到 从 头 开始 设计 这 些 类 ， 因 为 这 样 做 会 重复 创建 通用 的 AddressBook 
类 时 的 操作 。 包 含 AddressBook 类 所 有 的 特征 和 特性 并 加 入 需要 的 定制 特性 不 是 很 好 吗 ? 这 就 是 类 
派生 的 动机 和 要 求 。 




















13. 10.1 创建 子 类 
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ee 
T T 


创建 子 类 的 语法 看 起 来 与 普通 (新 式 ) 类 没有 区 别 ， 一 个 类 名 ， 后 跟 一 个 或 多 个 需要 从 其 中 派生 
的 父 类 : 
class SubClassName (ParentClass1/, ParentClass2, ...]): 
'optional class documentation string’ 














class suite 


如 果 你 的 类 没有 从 任何 祖先 类 派生 ， 可 以 使 用 object 作为 父 类 的 名 字 。 经 典 类 的 声明 唯一 不 同 
之 处 在 于 其 没有 从 祖先 类 派生 一 一 一 此 时 ， 没 有 圆 括号 : 


class ClassicClassWithoutSuperclasses: 








pass 





至 此 ， 我 们 已 经 看 到 了 一 些 类 和 子 类 的 例子 ， 下 面 还 有 一 个 简单 的 例子 : 
class Parent(object): # define parent class 定义 父 类 
def parentMethod (self): 


print 'calling parent method' 








class Child(Parent): # define child class 定义 子 类 

def childMethod (self): 

print 'calling child method' 

>>> p = Parent() # instance of parent 父 类 的 实例 

>>> p. parentMethod () 

calling parent method 
222 
>>> c = ChildO 8 instance of child 子 类 的 实例 
>>> c.childMethod( # child calls its method 子 类 调用 它 的 方法 
calling child method 
>>> c.parentMethod() # calls parent’ s method 调用 父 类 的 方法 
calling parent method 





I 


13. 11 继承 


继承 描述 了 基 类 的 属性 如 何 “ 遗 传 ” 给 派生 类 。 一 个 子 类 可 以 继承 它 的 基 类 的 任何 属性 ， 不 
是 数据 属性 还 是 方法 。 


D 





























举 个 例子 如 下 。P 是 一 个 没有 属性 的 简单 类 。C 从 P 继承 而 来 《因此 是 它 的 子 类 )， 也 没有 属性 : 


class P(object):  £ parent class KÆ 
pass 
class C(P): # child class J% 





$— E 
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pass 





2 c =C0 # instantiate child EØF Z 

2 c. class # child "is a^ parent JZ "4 —4" RA 
<class ' main . C> 

2> C bases # child’s parent class (es) -F28fjfá 2s 
(<class ' main .P'») 


因为 P 没 有 属性 ，C 没有 继承 到 什么 。 下 面 我 们 给 P 添加 一 些 属性 : 


class P:# parent class KÆ 














'P class' 

def init (self): 
print 'created an instance of’, | 
self. class . name 





class CŒ): # child class J% 


pass 











现在 所 创建 的 P 有 文档 字符 串 〈_ doe O 和 构造 器 ， 当 我 们 实例 化 P 时 它 被 执行 ， 如 下 面 的 
交互 会 话 所 示 : 

»2^p-PQ # parent instance RALPH 

created an instance of P 

2»? p class £ class that created us di p MBNA 

<class ' main .PD 

2^ P bases # parent's parent class(es) RAWKE 

«type 'object'»,) 

2)^P doc X4 parent's doc string XAHYXMPTF ITA 

'P class’ 


“created an instance" 72H init 0 直接 输出 的 。 我 们 也 可 显示 更 多 关于 父 类 的 信息 。 我 
们 现在 来 实例 化 C， 展 示 init 0 (构造 ) 方法 在 执行 过 程 中 是 如 何 继承 的 : 





> c = CO # child instance FAH 

created an instance of C 

2^ c._ class # class that created us ‘ey, c PrABIZS S 
<class ” main UC 

2^ C.. bases # child’s parent class(es) -F28ffá zs 
(<class ' main .P'») 

2> C. doc # child's doc string FÆI FIFE 
225 
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CHARH init 0 方法 ,然而 在 类 C 的 实例 c 被 创建 时 ， 还 是 会 有 输出 信息 。 原 因 在 于 CZ 
承 了 P 的 _init O0. bases 元 组 列 出 了 其 父 类 P。 需 要 注意 的 是 文档 字符 串 对 类 ,函数 /方法 ， 
还 有 模块 来 说 都 是 唯一 的 ， 所 以 特殊 属性 ”doc_ 不 会 从 基 类 中 继承 过 来 。 





























13.11.1 | bases 类 属性 





在 第 13.4.4 节 中 ， 我 们 概要 地 介绍 了 _bases 类 属性 ， 对 任何 ( 子 ) 类 , 它 是 一 个 包含 其 父 类 
(parent) 的 集合 的 元 组 。 注 意 ， 我 们 明确 指出 “ 父 类 ”是 相对 所 有 基 类 《〈 它 包括 了 所 有 祖先 类 ) 
而 言 的 。 那 些 没 有 父 类 的 类 ， 它 们 的 _bases 属性 为 空 。 下 面 我 们 看 一 下 如 何 使 用 _bases_ 的。 























2»? class A(object): pass # define class A 4E X 2E A 

»» class B(A): pass # subclass of A A HITZ 

»» class C(B): pass # subclass of B (and indirectly, A) B HIFZ (A IEEE 28) 
»» class D(A, B): pass # subclass of A and B A, B PITZ 


222 4 bases __ 


(type 'object'»,) 
220 bases __ 
(<class | main .B at 8120c905,) 
2> DD bases _ 


(class main .A at 811fc90^, <class | main .B at 8120c90>) 





在 上 面 的 例子 中 ， 尽 管 C 是 A 和 8B 的 子 类 (通过 B 传递 继承 关系 )， 但 C 的 父 类 是 B， 这 从 它 的 
声明 中 可 以 看 出 ， 所 以 ， 只 有 B 会 在 C. bases 中 显示 出 来 。 另 一 方面 , D 是 从 两 个 类 A 和 B 中 继 
承 而 来 的 。 (多重 继承 参见 13. 11. 4) 








13.11.2 通过 继承 覆盖 〈0verriding) 方法 


我 们 在 P 中 再 写 一 个 函数 ， 然 后 在 其 子 类 中 对 它 进行 履 盖 。 
class P(object): 
def foo(self): 
print 'Hi, I am P-foo()’ 


2 p = PO 
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ee 
Ss doe i 
Hi, I am P-foo() 








现在 来 创建 子 类 C， 从 父 类 了 派生: 
class CU. 
def foo(self): 
print 'Hi, I am C-foo()’ 


》>c =CO 
222 c. foo 
Hi, I am C-foo() 


尽管 C 继承 了 P 的 foo() 方 法 ， 但 因为 C 定义 了 它 自己 的 foo ME, BEDA P 中 的 foo) 方法 
被 覆盖 。 覆 盖 方 法 的 原因 之 一 是 ， 你 的 子 类 可 能 需要 这 个 方法 具有 特定 或 不 同 的 功能 。 所 以 ， 你 接 
下 来 的 问题 肯定 是 :“ 我 还 能 否 调用 那个 被 我 覆盖 的 基 类 方法 呢 ? ” 


















































答案 是 肯定 的 ， 但 是 这 时 就 需要 你 去 调用 一 个 未 绑 定 的 基 类 方法 ， 明 确 给 出 子 类 的 实例 ， 例 如 
T: 

222 P. foo(c) 

Hi, I am P-foo() 











注意 ， 我 们 上 面 已 经 有 了 一 个 P 的 实例 p， 但 上 面 的 这 个 例子 并 没有 用 它 。 我 们 不 需要 P 的 实 
例 调用 中 的 方法 ， 因 为 已 经 有 一 个 P KTRK c 可 用 。 和 典型 情况 下 , 你 不 会 以 这 种 方式 调用 父 类 
方法 , 你 会 在 子 类 的 重 写 方法 里 显 式 地 调用 基 类 方法 。 
































clase CU. 
def foo(self): 
P. foo (self) 
print 'Hi, I am C-foo()’ 








Ho. FERS CORSE) 方法 调用 中 我 们 显 式 地 传递 了 self， 一 个 更 好 的 办 法 是 使 用 super 0 
内 建 方法 : 





class CU; 
def foo(self): 
super (C, self). foo 0 
print 'Hi, I am C-foo()’ 








super () 不 但 能 找到 基 类 方法 ， 而 且 还 为 我 们 传 进 self， 这 样 我 们 就 不 需要 做 这 些 事 了 。 现 在 我 
们 只 要 调用 子 类 的 方法 ， 它 会 帮 你 完成 一 切 : 











$— 一 * 一 
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rs 
1 


pM DP 
222 c. foo () 
Hi, I am P-foo() Hi, I am C-foo() 





核心 笔记 : E5 init 不 会 自动 调用 基 类 的 _init — 
类 似 于 上 面 的 有 覆盖 非特 殊 方法 ， 当 从 一 个 带 构造 器  — initO — 的 类 派生 ， 如 果 你 不 去 覆盖 
_ init ()， 它 将 会 被 继承 并 自动 调用 。 但 如 果 你 在 子 类 中 用 盖 了 _ init QO， 子 类 被 实例 化 时 ， 
基 类 的 ”init 0 就 不 会 被 自动 调用 。 这 可 能 会 让 了 解 JAVA 的 朋友 感到 吃惊 。 
class P(object): 
def init (self): 
print “calling P's constructor” 


class C(P): 
def init (self): 
print ^calling C's constructor^ 


》>>ec = CO) 
calling C's constructor 
如 果 你 还 想 调用 基 类 的 _ init  O. ， 你 需要 像 上 边 我 们 刚 说 的 那样 ， 明 确 指 出 ， 使 用 一 个 子 
类 的 实例 去 调用 基 类 RRE) 方法 。 相 应 地 更 新 类 C， 会 出 现下 面 预期 的 执行 结果 : 
class C(P): 
def init (self): 
P init (self) 
print “calling C's constructor” 


»> c = CO 

calling P’s constructor 

calling C’s constructor 

上 边 的 例子 中 , 子 类 的 _init 0 方法 首先 调用 了 基 类 的 的 _init 0 方法 。 这 是 相当 普遍 (不 
是 强制 ) 的 做 法 ， 用 来 设置 初始 化 基 类 ， 然 后 可 以 执行 子 类 内 部 的 设置 。 这 个 规则 之 所 以 有 意义 的 
原因 是 , 你 希望 被 继承 的 类 的 对 象 在 子 类 构造 器 运行 前 能 够 很 好 地 被 初始 化 或 作 好 准备 工作 ， 因 为 它 
( 子 类 ) 可 能 需要 或 设置 继承 属性 。 

对 C++ 熟悉 的 朋友 ， 可 能 会 在 派生 类 构造 器 声明 时 , 通过 在 声明 后 面 加 上 冒号 和 所 要 调用 的 所 有 
基 类 构造 器 这 种 形式 来 调用 基 类 构造 器 。 而 在 JAVA 中 ， 不 管 程序 员 如 何 处 理 ， 子 类 构造 器 都 会 去 调 
用 基 类 的 的 构造 器 。 

Python 使 用 基 类 名 来 调用 类 方法 , 对 应 在 JAVA 中 , 是 用 关键 字 super 来 实现 的 , 这 就 是 super () 
内 建 函 数 引 入 到 Python 中 的 原因 ， 这 样 你 就 可 以 “ 依 戎 疡 画 昧 ”了 : 

class C(P): 











Edit By Vheavens 


Edit By Vheavens 





e | 
def init (self): 
super(G self). init (0 
print “calling C's constructor” 
使 用 super O 的 漂亮 之 处 在 于 ,你 不 需要 明确 给 出 任何 基 类 名 字 . ..“ 跑 腿 事 儿 ”, 它 帮 你 干 了 ! 
使 用 super O 的 重点 ， 是 你 不 需要 明确 提供 父 类 。 这 意味 着 如 果 你 改变 了 类 继承 关系 ， 你 只 需要 改 一 
AT ARES (class 语 名 本身) 而 不 必 在 大 量 代 码 中 去 查找 所 有 被 修改 的 那个 类 的 名 字 。 


13. 11. 3 从 标准 类 型 派生 
经 典 类 中 ， 一 个 最 大 的 问题 是 ， 不 能 对 标准 类 型 进行 子 类 化 。 幸 运 的 是 ， 在 2. 2 以 后 的 版 本 中 ， 


随 着 类 型 (types) MIZE (class) 的 统一 和 新 式 类 的 引入 ， 这 一 点 已 经 被 修正 。 下 面 ， 介 绍 两 个 子 
类 化 Python 类 型 的 相关 例子 ， 其 中 一 个 是 可 变 类 型 ， 另 一 个 是 不 可 变 类 型 。 





不 可 变 类 型 的 例子 























假定 你 想 在 金融 应 用 中 , 应 用 一 个 处 理 浮 点 数 的 子 类 。 每 次 你 得 到 一 个 贷 币 值 ( 浮 点 数 给 出 的 )， 
你 都 需要 通过 四 舍 五 入 ， 变 为 带 两 位 小 数位 的 数值 。( 当 然 ，Decimal 类 比 起 标准 浮 点 类 型 来 说 是 个 
用 来 精确 保存 浮 点 值 的 更 佳 方案 ， 但 你 还 是 需要 [有 时 候 」 对 其 进行 舍 入 操作 !) 你 的 类 开始 可 以 


这 样 写 : 
class RoundFloat (float): 


def new (cls, val): 
return float. new (cls, round(val, 2)) 
































我 们 履 盖 了 _new__() 特殊 方法 来 定制 我 们 的 对 象 ， 使 之 和 标准 Python 浮 点 数 (float) 有 一 些 
区 别 ; 我 们 使 用 round O 内 建 浮 数 对 原 浮 点 数 进行 舍 入 操作 , 然后 实例 化 我 们 的 float, RoundFloat. 
我 们 是 通过 调用 父 类 的 构造 器 来 创建 真实 的 对 象 的 ，float. new ()。 注 意 ， 所 有 的 _newQO_ 方 
法 都 是 类 方法 , 我 们 要 显 式 传 入 类 传 为 第 一 个 参数 , 这 类 似 于 常见 的 方法 如 _ init 0 中 需要 的 self。 
































现在 的 例子 还 非常 简单 ,比如 , 我们 知道 有 一 个 float, 我 们 仅仅 是 从 一 种 类 型 中 派生 而 来 等 等 . 
通常 情况 下 ， 最 好 是 使 用 super 0 内 建 函 数 去 捕获 对 应 的 父 类 以 调用 它 的 _new 上 _ 方法， 下 面 ， 对 
它 进行 这 方面 的 修改 : 

















class RoundFloat (float): 
def new (cls, val): 
return super(KoundFloat, cls). new (cls, round(val, 2)) 





这 个 例子 还 远 不 够 完整 ， 所以, 请 留意 本 章 我 们 将 使 它 有 更 好 的 表现 。 下面 是 一 些 样 例 输出 : 
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> RoundFloat (1. 5955) 





1.6 

> RoundFloat (1. 5945) 
1. 59 

> RoundFloat (-1. 9955) 
-2 0 

可 变 类 型 的 例子 





子 类 化 一 个 可 变 类 型 与 此 类 似 ， 你 可 能 不 需要 使 用 _new__() (或 甚至 init 0 )， 因 为 通常 
设置 不 多 。 一 般 情 况 下 ， 你 所 继承 到 的 类 型 的 默认 行为 就 是 你 想 要 的 。 下 例 中 ， 我 们 简单 地 创建 一 
个 新 的 字典 类 型 ， 它 的 keys 0 方法 会 自动 排序 结果 : 





























class SortedKeyDict (dict): 
def keys(self): 
return sorted(super( SortedKeyDict, self). keys ()) 


回忆 一 下 ,字典 (dictionary) 可 以 由 dict O , dict (mapping), dict (sequence of 2 tuples), 
或 者 dict (#x#kwargs) 来 创建 ， 看 看 下 面 使 用 新 类 的 例子 : 





d = SortedkeyDict ((( zheng-cai', 67), (hui-jun’, 68), (xin-yi’, 2))) 
print 'By iterator:'.ljust(12), [key for key in d/ 
print 'By keys():'. ljust 12), d. keys O 





把 上 面 的 代码 全 部 加 到 一 个 脚本 中 ， 然 后 运行 ， 可 以 得 到 下 面 的 输出 : 


By iterator: [’zheng-cai’, 'xin-yi , 'hui-jun ] 
By keys: ['xin-yi', 'hui-jun', 'zheng-cai' / 


在 上 例 中 ， 通 过 keys 迭代 过 程 是 以 散 列 顺序 的 形式 ， 而 使 用 我 们 ( 重 写 的 ) keys 0 〇 方法 则 将 
keys 变 为 字母 排序 方式 了 。 




















一 定 要 谨慎 ,而 且 要 意识 到 你 正在 干什么 。 如 果 你 说 ,“ 你 的 方法 调用 super O 过 于 复杂 ”， 取 而 
代 之 的 是 ， 你 更 喜欢 keys O 简 简 单单 (也 容易 理解 )....， 像 这 样 : 








def keys(self): 
return sorted (self. keys 0) 


这 是 本 章 后 面 的 练习 13-19. 
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13. 11.4 多 重 继承 


同 C++ 一 样 ，Python 人 允许 子 类 继承 多 个 基 类 。 这 种 特性 就 是 通常 所 说 的 多 重 继承 。 概 念 容易 ， 
但 最 难 的 工作 是 ， 如 何 正 确 找 到 没有 在 当前 ( 子 ) 类 定义 的 属性 。 当 使 用 多 重 继承 时 ， 有 两 个 不 同 
的 方面 要 记 住 。 首 先 ， 还 是 要 找到 合适 的 属性 。 男 一 个 就 是 当 你 重 写 方法 时 ， 如 何 调 用 对 应 父 类 方 
法 以 “发 挥 他 们 的 作用 ”， 同时， 在 子 类 中 处理 好 自己 的 义务 。 我 们 将 讨论 两 个 方面 ， 但 侧重 后 者 ， 
讨论 方法 解析 顺序 。 




































































方法 解释 顺序 (MRO) 








在 Python 2.2 以 前 的 版 本 中 ， 算 法 非常 简单 : 深度 优先 ， 从 左 至 右 进行 搜索 ， 取 得 在 子 类 中 使 
用 的 属性 。 其 它 Python 算法 只 是 覆盖 被 找到 的 名 字 ， 多 重 继承 则 取 找 到 的 第 一 个 名 字 。 














由 于 类 ， 类 型 和 内 建 类 型 的 子 类 ， 都 经 过 全 新 改造 ， 有 了 新 的 结构 ， 这 种 算法 不 再 可 行 ， 这样 
一 种 新 的 MRO 算法 被 开发 出 来 ， 在 2. 2 版 本 中 初次 登场 ， 是 一 个 好 的 答 试 ， 但 有 一 个 缺陷 〈 看 下 面 
的 核心 笔记 )。 这 在 2. 3 版 本 中 立即 被 修改 ， 也 就 是 今天 还 在 使 用 的 版 本 。 














精确 顺序 解释 很 复杂 ， 超 出 了 本 文 的 范畴 ， 但 你 可 以 去 阅读 本 节 后 面 的 参考 书目 提 到 的 有 关内 
容 。 这 里 提 一 下 ， 新 的 查询 方法 是 采用 广度 优先 ， 而 不 是 深度 优先 。 














核心 笔记 : Python 2.2 使 用 一 种 唯一 但 不 完善 的 MRO 

Python 2.2 是 首 个 使 用 新 式 MO 的 版 本 ， 它 必须 取代 经 典 类 中 的 算法 ， 原 因 在 上 面 已 谈 到 过 。 
在 2.2 版 本 中 ， 算 法 基本 思想 是 根据 每 个 祖先 类 的 继承 结构 ， 编 译 出 一 张 列 表 ， 包 括 搜索 到 的 类 ， 
按 策略 删除 重复 的 。 然 而 ， 在 Python 核心 开发 人 员 邮 件 列表 中 ， 有 人 指出 ， 在 维护 单调 性 方面 失败 
过 (顺序 保存 )， 必 须 使 用 新 的 C3 算法 蔡 换 ， 也 就 是 从 2.3 版 开始 使 用 的 新 算法 。 








下 面 的 示例 ， 展 示 经 典 类 和 新 式 类 中 ， 方 法 解释 顺序 有 什么 不 同 。 





简单 属性 查找 示例 





下 面 这 个 例子 将 对 两 种 类 的 方案 不 同 处 做 一 展示 。 脚 本 由 一 组 父 类 ， 一 组 子 类 ， 还 有 一 个 子孙 
类 组 成 。 














class Pl: #(object): # parent class 1 281 
def foo(self): 
print 'called P1-foo()’ 


class P2: #(object): # parent class 2 KÆ 2 
def foo(self): 
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def bar (self): 
print 'called P2-bar()’ 


print ‘called P2-foo()’ 


class CI(PL P2): # child 1 der. from PL P2 #72% 1, M PL, P2 MRA 


pass 


class C2(PL P2): # child 2 der. from PL P2 #72% 2, M PL P2 IA 


def bar(self): 
print 'called C2-bar 0’ 


class GC(CL C2): # define grandchild class KEX FIFE 
pass # derived from Cl and C2 ZA CL C2 MA 


( £00) P1 P2 (foo, bar) 


C1 C2 (bar) 


GC 


图 13-2 ” 父 类 ， 子 类 及 子孙 类 的 关系 图 ， 还 有 它们 各 自 定 义 的 方法 








在 图 13-2 中 ,我 们 看 到 父 类 , 子 类 及 子孙 类 的 关系 。P1 中 定义 了 foo(,P2 定 义 了 fooO 和 bar()， 


C2 定义 了 bar 0 。 下 面 举例 说 明 一 下 经 典 类 和 新 式 类 的 行为 。 


经 典 类 





首先 来 使 用 经 典 类 。 通 过 在 交互 式 解释 器 中 执行 上 面 的 声明 ， 我 们 可 以 验证 经 典 类 使 用 的 解释 


顺序 ， 深 度 优 先 ， 从 左 至 右 : 
AM» ge = GCO 
AS gc. foo) # GC ==> CI => Pi 
called P1-foo() 
222 gc. bar 0 # GC ==> CI ==> PI ==> P2 
called P2-bar () 











当 调用 fooO 时 ， 它 首先 在 当前 类 (6GC) 中 查找 。 如 果 没 找到 ， 就 向 上 查找 最 亲 的 父 类 ，C1。 查 找 


未 遂 ， 就 继续 沿 树 上 访 到 父 类 Pl1，foo0 被 找到 。 





$— E 








e 
| 
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同样 , 对 bar 0 来 说 , 它 通 过 搜索 GC, Cl, P1 然后 在 P2 中 找到 。 因 为 使 用 这 种 解释 顺序 的 缘故 ， 
C2. bar O 根本 就 不 会 被 搜索 了 。 





现在 ， 你 可 能 在 想 ,“ 我 更 愿意 调用 C2 的 bar () 方 法 ， 因 为 它 在 继承 树 上 和 我 更 亲近 些 ， 这 样 才 
会 更 合适 。” 在 这 种 情况 下 ， 你 当然 还 可 以 使 用 它 ， 但 你 必须 调用 它 的 合法 的 全 名 ， 采 用 典型 的 非 绑 
定 方式 去 调用 ， 并 且 提 供 一 个 合法 的 实例 : 








2^ C2. bar (gc) 
called C2-bar () 


新 式 类 





取消 类 P1 和 类 P2 声明 中 的 对 (object) 的 注释 ， 重 新 执行 一 下 。 新 式 方法 的 查询 有 一 些 不 同 : 





M» ge = GCO 

2M» gc. foo)  # GC ==> Cl ==> C2 ==> PI 
called P1-foo() 

B2» gc. bar # GC => C1 > C2 

called C2-bar () 





与 治 着 继承 树 一 步 一 步 上 漳 不 同 ， 它 首先 查找 同胞 兄弟 ， 采 用 一 种 广度 优先 的 方式 。 当 查找 
foo () ， 它 检查 6C， 然 后 是 C1 和 C2， 然 后 在 Pl 中 找到 。 如 果 PL 中 没有 ， 查 找 将 会 到 达 P2。foo () 
的 底线 是 ， 包 括 经 典 类 和 新 式 类 都 会 在 Pl 中 找到 它 ， 然 而 它们 虽然 是 同 归 ， 但 殊 途 ! 














然而 ，bar 0 的 结果 是 不 同 的 。 它 搜 索 GC 和 C1， 紧 接着 在 C2 中 找到 了 。 这 样 ， 就 不 会 再 继续 搜 
索 到 祖父 P1 和 P2。 这 种 情况 下 ， 新 的 解释 方式 更 适合 那 种 要 求 查 找 GC 更 杂 近 的 bar O 的 方案 。 当 
然 ， 如 果 你 还 需要 调用 上 一 级 ， 只 要 按 前 述 方法 ， 使 用 非 绑 定 的 方式 去 做 ， 即 可 。 

















22^» P2. bar (gc) 
called P2-bar 0 


新 式 类 也 有 一 个 mro JmfE, FRERE E FER: 








2^ GC. mro 

(<class ' main .GC'^ <class ' main .CI'^ <class 
” main .CZ >, <class “main LQP1 X <class 

” main .P2'^ «type object’ >) 


菱形 效应 为 难 MRO 
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经 典 类 方法 解释 不 会 带 来 很 多 问题 。 它 很 容易 解释 ， 并 理解 。 大 部 分 类 都 是 单 继承 的 ， 多 重 继 
承 只 限 用 在 对 两 个 完全 不 相关 的 类 进行 联合 。 这 就 是 术语 mixin 类 (或 者 “mix-ins”) 的 由 来 。 

















为 什么 经 典 类 MRO 会 失败 


在 版 本 2.2 中 ， 类 型 与 类 的 统一 ， 带 来 了 一 个 新 的 “问题 ”， 波 及 所 有 从 object AXW WE 
先 类 ) 派生 出 来 的 〈 根 ) 类 ， 一 个 简单 的 继承 结构 变 成 了 一 个 萎 形 。 从 Guido van Rossum 的 文章 
中 得 到 下 面 的 灵感 ， 打 个 比方 ， 你 有 经 典 类 B 和 C, AmS AER, BRA, D 从 B 和 CC 继承 而 来 : 














class B: 


pass 


class C: 
def init (self): 
print “the default constructor^ 


class D(B, C: 


pass 


当 我 们 实例 化 D， 得 到 : 


2>2> gq = DO 
the default constructor 





图 13.3 AB, CAD 的 类 继承 结构 ， 现 在 把 代码 改 为 采用 新 式 类 的 方式 ， 问 题 也 就 产生 了 : 


class B(object): 


pass 


class C(object): 
def init (self): 
print “the default constructor^ 
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(object) 
A 
a 
av nt a 
D D 
Classic New-style 
classes classes 











图 13.3 继承 的 问题 是 由 于 在 新 式 类 中 ， 需 要 出 现 基 类 ， 这 样 就 在 继承 结构 中 ， 形 成 了 一 个 
ZE. D 的 实例 上 询 时 ,不 应 当 错 过 C, 但 不 能 两 次 上 漳 到 A (因为 B 和 C 都 从 A 派生 )。 去 读 读 Guido 
van Rossum 的 文章 中 有 关 ” 协 作 方法 ”的 部 分 ， 可 以 得 到 更 深 地 理解 。 











代码 中 仅仅 是 在 两 个 类 声明 中 加 入 了 (object) ， 对 吗 ? 没 错 ， 但 从 图 中 ， 你 可 以 看 出 ， 继 承 结 
构 已 变 成 了 一 个 葵 形 ; 真正 的 问题 就 存在 于 MRO 了 。 如 果 我 们 使 用 经 典 类 的 MR0， 当 实例 化 D 时 ， 不 
再 得 到 C. init Oz£ZHm..... 而 是 得 到 object. init (OQ! 这 就 是 为 什么 MO 需要 修改 的 真正 


原因 。 











尽管 我 们 看 到 了 ， 在 上 面 的 例子 中 ， 类 GC 的 属性 查找 路 径 被 改变 了 ， 但 你 不 需要 担心 会 有 大 量 


MM Ei 


的 代码 骨 尝 。 经 典 类 将 沿用 老式 MRO0， 而 新 式 类 将 使 用 它 自 己 的 MR0。 还 有 ， 如 果 你 不 需要 用 到 新 
式 类 中 的 所 有 特性 ， 可 以 继续 使 用 经 典 类 进行 开发 ， 不 会 有 问题 的 。 











总 结 








经 典 类 ， 使 用 深度 优先 算法 。 因 为 新 式 类 继承 自 object， 新 的 萎 形 类 继承 结构 出 现 ， 问 题 也 就 
接着 而 来 了 ， 所 以 必须 新 建 一 个 MR0。 





你 可 以 在 下 面 的 链接 中 读 在 更 多 有 关 新 式 类 、MRO 的 文章 : 


Guido van Rossum 的 有 关 类 型 和 类 统一 的 文章 ; 
http://www. python. org/download/releases/2. 2. 3/descrintro 


PEP 252: 使 类 型 看 起 来 更 像 类 
http://www. python. org/doc/peps/pep-0252 


“Python 2.2 新 亮点 ” 文档 
http://www. python. org/doc/2. 2. 3/whatsnew 





论文 : Python 2.3 方法 解释 顺序 
http: //python. org/download/releases/2. 3/mro/ 
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13.12. 类、 实例 和 其 他 对 象 的 内 建 函 数 


13.12. 1 issubclass () 


issubclass O 布尔 函数 判断 一 个 类 是 另 一 个 类 的 子 类 或 子孙 类 。 它 有 如 下 语法 : 








issubclass(sub, sup) 


issubclass() 返回 True 的 情况 :给 出 的 子 类 sub 确实 是 父 类 sup 的 一 个 子 类 (反之 , 则 为 False)。 
这 个 函数 也 允许 “不 严格 ”的 子 类 ， 意 味 着 ， 一 个 类 可 视 为 其 自身 的 子 类 ， 所 以 ， 这 个 函数 如 果 当 
sub 就 是 sup， 或 者 从 sup 派生 而 来 ， 则 返回 True。( 一 个 “严格 的 ” 子 类 是 严格 意义 上 的 从 一 个 类 
派生 而 来 的 子 类 。) 











从 Python 2. 3 开始 , issubclass O 的 第 二 个 参数 可 以 是 可 能 的 父 类 组 成 的 tuple (元 组 ), 这 时 ， 
只 要 第 一 个 参数 是 给 定 元 组 中 任何 一 个 候选 类 的 子 类 时 ， 就 会 返回 True. 





13. 12.2 isinstance() 








isinstance() 布尔 函数 在 判定 一 个 对 象 是 否 是 另 一 个 给 定 类 的 实例 时 ， 非 常 有 用 。 它 有 如 下 





语法 : 











isinstance(objl, objZ) 


isinstance Q0 Æ objl 是 类 obj2 的 一 个 实例 ， 或 者 是 obj2 的 子 类 的 一 个 实例 时 ， 返 回 True 
(反之 ， 则 为 False)， 看 下 面 的 例子 : 


225 


DA 


222 
eee 
Poe 
eee 
pre 
Po? 
eee 








class Cl(object): pass 
class C2(object): pass 


el = C10 

c2 = C20 

isinstance(cl, CI) True 

isinstance(c2, Cl) False 

isinstance(cl, C2) False 

isinstance(cZ, C2) True 

isinstance(C2, c2) Traceback (innermost last): 
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File &stdin^/^, line L in ? 
isinstance(C2, c2) 
TypeError: second argument must be a class 





注意 : 第 二 个 参数 应 当 是 类 ; 不 然 ， 你 会 得 到 一 个 TypeError。 但 如 果 第 二 个 参数 是 一 个 类 型 对 
象 ， 则 不 会 出 现 异常 。 这 是 允许 的 ， 因 为 你 也 可 以 使 用 isinstance (来 检查 一 个 对 象 objl 是 否 是 
obj2 的 类 型 ， 比 如 : 


22^ isinstance(4, int) 
True 

22^ isinstance (4, str) 
False 

2» isinstance( 4’, str) 
True 


如 果 你 对 Java 有 一 定 的 了 解 ， 那 么 你 可 能 知道 Java 中 有 个 等 价 函数 叫 instanceof 0, (AHF 
性 能 上 的 原因 ，instanceof O 并 不 被 推荐 使 用 。 调 用 Python 的 isinstance 0 不 会 有 性 能 上 的 问题 ， 
主要 是 因为 它 只 用 来 来 快速 搜索 类 族 集成 结构 ， 以 确定 调用 者 是 哪个 类 的 实例 ， 还 有 更 重要 的 是 ， 
它 是 用 C 写 的 ! 


























E] issubclass 0) 一样 ，isinstance() 也 可 以 使 用 一 个 元 组 (tuple) 作为 第 二 个 参数 。 这 个 特 : 
性 是 从 Python 2.2 版 本 中 引进 的 。 如 果 第 一 个 参数 是 第 二 个 参数 中 给 定 元 组 的 任何 一 个 候选 类 型 

或 类 的 实例 时 ， 就 会 返回 True。 你 还 可 以 在 595 页 ， 第 13. 16. 1 节 中 了 解 到 更 多 有 isinstance () 的 

内 容 。 





13.12.3 hasattr(), getattr(),setattr(), delattr() 


*attr O 系列 函数 可 以 在 各 种 对 象 下 工作 ， 不 限于 类 (class) 和 实例 Cinstances). Afi, 
为 在 类 和 实例 中 使 用 极其 频繁 ， 就 在 这 里 列 出 来 了 。 需 要 说 明 的 是 ， 当 使 用 这 些 函 数 时 ， 你 传 入 你 
正在 处 理 的 对 象 作为 第 一 个 参数 ， 但 属性 名 ， 也 就 是 这 些 函数 的 第 二 个 参数 ， 是 这 些 属 性 的 字符 串 
名 字 。 换 句 话 说， 在 操作 obj.attr 时 ， 就 相当 于 调用 #xattr(obj，attr ....) 系 列 函 数 一 一 一 下 面 
的 例子 讲 得 很 清楚 。 























hasattr () RACE Boolean 型 的 ， 它 的 目的 就 是 为 了 决定 一 个 对 象 是 否 有 一 个 特定 的 属性 ， 
般 用 于 访问 某 属性 前 先 作 一 下 检查 。getattr() 和 setattr O 函数 相 应 地 取得 和 赋值 给 对 象 的 属性 ， 
getattr (会 在 你 试图 读 取 一 个 不 存在 的 属性 时 ， 引 发 AttributeError 异常 ， 除 非 给 出 那个 可 选 的 
默认 参数 。setattr () 将 要 么 加 入 一 个 新 的 属性 ， 要 么 取代 一 个 已 存在 的 属性 。 而 delattr 0 函数 会 
从 一 个 对 象 中 删除 属性 。 


Here are some examples using all the *attr( BIFs: 
































—- 








$— 一 * 一 
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下 面 一 些 例 子 使 用 到 了 #attr O 系列 函数 : 





222 class myClass (object): 
def init (self): 
self. foo = 100 


2» myinst = myClass () 
22» hasattr(myInst, 'foo') 
True 
22^ getattr(myInst, 'foo') 
100 
22^ hasattr(myInst, 'bar') False 
22^ getattr(myInst, "bar’) Traceback (most recent call last): 
File “stdin, line l, in ? 
getattr(myInst, 'bar') 
AttributeError: myClass instance has no attribute 'bar' 
2»? getattr(c, 'bar', 'oops!') 
'oops!' 
2» setattr(myInst, bar’, my attr’) 
2225 dir(myInst) 
[’ doc ^", ' module ^", 'bar', 'foo'/ 
>> getattr(myInst, 'bar') # same as myInst. bar ##/Alf* myInst. bar 
'my attr’ 
222 delattr(myInst, 'foo') 
222^ dir (myInst) 
[’ doc’, ' module’, *bar’/ 
22» hasattr(myInst, ’ foo’) 
False 








13.12.4 dir 


前 面 用 到 dir () 是 在 练习 2-12, 2-13 和 4-7。 在 这 些 练 习 中 ， 我 们 用 dir O 列 出 一 个 模块 所 有 属 
性 的 信息 。 现 在 你 应 该 知道 dir () 还 可 以 用 在 对 象 上 。 




















Æ Python 2.2 中 ， dir OO 得 到 了 重要 的 更 新 。 因 为 这 些 改 变 ， 那 些 members 和 methods - 
数据 属性 已 经 被 宣告 即将 不 文 持 。dir 0 提供 的 信息 比 以 前 更 加 详尽 。 根 据 文档 ,“ 除 了 实例 变量 名 
和 常用 方法 外 ， 它 还 显示 那些 通过 特殊 标记 来 调用 的 方法 , 像 _iadd (+=), len (len()), 
ne (!=).” 在 Python 文档 中 有 详细 说 明 。 
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e dirOfFA ES PE (Asset) 时 ， 显 示 实 例 变量 ， 还 有 在 实例 所 在 的 类 及 所 有 它 
的 基 类 中 定义 的 方法 和 类 属性 。 

e dir() 作 用 在 类 上 (经 典 类 或 新 式 类 ) 时 , 则 显示 类 以 及 它 的 所 有 基 类 的 _dict 中 的 内 容 。 
但 它 不 会 显示 定义 在 元 类 (metaclass) 中 的 类 属性 。 

e dir 0 作用 在 模块 上 时 ， 则 显示 模块 的 _dict_ 的 内 容 。( 这 没 改 动 )。 

dir () 不 带 参数 时 ， 则 显示 调用 者 的 局 部 变量 。( 也 没 改动 )。 

e 关于 更 多 细节 :对 于 那些 覆盖 了 _dict Re class 属性 的 对 象 ， 就 使 用 它们 ; 出 于 向 后 兼 
容 的 考虑 ， 如 果 已 定义 了 _members ”和 methods _， 则 使 用 它们 。 

































































13.12.5 super () 


super () 函数 在 Python2. 2 版 本 新 式 类 中 引入 。 这 个 函数 的 目的 就 是 帮助 程序 员 找 出 相应 的 父 类 ， 
然后 方便 调用 相关 的 属性 。 一 般 情况 下 ， 程 序 员 可 能 仅仅 采用 非 绑 定 方式 调用 祖先 类 方法 。 使 用 
super (可 以 简化 搜索 一 个 合适 祖先 的 任务 ， 并 且 在 调用 它 时 ， 蔡 你 传 入 实例 或 类 型 对 象 。 




















在 第 13.11.4 节 中 ， 我 们 描述 了 文档 解释 顺序 (MR0)， 用 于 在 祖先 类 中 查找 属性 。 对 于 每 个 定 
义 的 类 ， 都 有 一 个 名 为 、mro_ 的 属性 ， 它 是 一 个 元 组 ， 按 照 他 们 被 搜索 时 的 顺序 ， 列 出 了 备 搜 索 


的 类 。 语 法 如 下 : : 
super (typel, obj]) 


给 出 type,superO “返回 此 type 的 父 类 ” 如 果 你 希望 父 类 被 绑 定 , 你 可 以 传 入 obj BR (obj 
必须 是 type 类 型 的 ) . 否则 父 类 不 会 被 绑 定 。obj 参数 也 可 以 是 一 个 类 型 ， 但 它 应 当 是 type 的 一 个 子 
类 。 通 常 ， 当 给 出 obj 时 : 





























e 如 果 obj 是 一 个 实例 ，isinstance (obj, type) 就 必须 返回 True 
e 如果 obj 是 一 个 类 或 类 型 ，issubclass (obj, type) 就 必须 返回 True 


事实 上 ，super () 是 一 个 工厂 函数 ， 它 创造 了 一 个 super object， 为 一 个 给 定 的 类 使 用 _mro__ 
去 查找 相应 的 父 类 。 很 明显 ， 它 从 当前 所 找到 的 类 开始 搜索 MR0。 更 多 详情 ， 请 再 看 一 下 Guido van 
Rossum 有 关 统 一 类 型 和 类 的 文章 ， 他 甚至 给 出 了 一 个 super O 的 纯 Python 实现 ， 这 样 ， 你 可 以 加 深 
其 印象 ， 知 道 它 是 如 何 工作 的 ! 

















最 后 想到 .... super) 的 主要 有 用途， 是 来 查找 父 类 的 属性 ， 比 如 ， 
super (MyClass, self). init ()。 如 果 你 没有 执行 这 样 的 查找 ， 你 可 能 不 需要 使 用 super () o 








有 很 多 如 何 使 用 super O 的 例子 分 散在 本 章 中 。 记 得 阅读 一 下 第 13. 11. 2 节 中 有 关 super 0 的 重 
要 提示 ， 尤 其 是 那 节 中 的 核心 笔记 。 
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13.12.6 varsQ 








vars O 内 建 函 数 与 dir() 相似 ， 只 是 给 定 的 对 象 参 数 都 必须 有 一 个 _dict JBM. vars 0 返回 一 
个 字典 ， 它 包含 了 对 象 存储 于 其 _dict ”中 的 属性 ( 键 ) 及 值 。 如 果 提 供 的 对 象 没有 这 样 一 个 属性 ， 
则 会 引发 一 个 TypeError 异常 。 如 果 没 有 提供 对 象 作 为 vars 0 的 一 个 参数 ， 它 将 显示 一 个 包 售 本 地 
名 字 空 间 的 属性 ( 键 ) 及 其 值 的 字典 , 也 就 是 , locals O 。 我 们 来 看 一 下 例子 , 使 用 类 实例 调用 vars O : 
































class C(object): 


pass 


Dec =CO 
222 c. foo = 100 
2^ c. bar = 'Python' 
D>» c._ dict __ 
{’ foo’: 100, 'bar': 'Python'] 
22» vars (c) 
lfoo': 100, 'bar': 'Python'] 


表 13. 3 概括 了 类 和 类 实例 的 内 建 函数 。 





表 13.3 类 ， 实 例 及 其 它 对 象 的 内 建 函 数 











内 建 函 数 描述 
issubclass(sub, sup) 如 果 类 sub 是 类 sup 的 子 类 ， 则 返回 True, RZ, X False. 


isinstance(objl, ob j2) 如 果实 例 objl 是 类 obj2 或 者 opj2 子 类 的 一 个 实例 ;或 者 如 果 objl 
是 obj2 的 类 型 ， 则 返回 True; 反之 ， 为 False。 

hasattr (obj, attr) WR obj 有 属性 attr〔 用 字符 串 给 出 )， 返 回 True， 反 之 ， 返 回 
表 13.3 类 ， 实 例 及 其 它 对 象 的 内 建 函 数 CE) 











内 建 函 数 描述 
getattr(obj, attr[, default]) 获取 obj HJ attr 属性 ; 与 返回 obj. attr RW; 如 果 attr 
不 是 obj 的 属性 , 如 果 提 供 了 默认 值 , 则 返回 默认 值 ; 不 然 ， 


就 会 引发 一 个 AttributeError 异常 。 









































setattr (obj, attr, val) 设置 obj 的 attr 属性 值 为 val, 蔡 换 任何 已 存在 的 属性 值 ; 
不 然 ， 就 创建 属性 ;类 似 于 obj. attr=val 

delattr (obj, attr) 从 obj 中 删除 属性 attr 以 字符 串 给 出 );， 类 似 于 del 
obj. attr. 

dir (ob j=None) 返回 obj 的 属性 的 一 个 列表 ; 如 果 没 有 给 定 obj, dir O W 
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显示 局 部 名 字 空 间 空间 中 的 属性 , Hii locals (). keys O 

super (type, obj-None)* 返回 一 个 表示 父 类 类 型 的 代理 对 象 ， 如果 没有 传 入 obj, 
则 返 回 的 super 对 象 是 非 绑 定 的 ， 反之， 如果 obj 是 一 个 
type , issubclass(obj,type) 4^ 7j True; F MJ, 
isinstance (obj, type) 就 必 为 True。 




















vars (ob j=None) 返回 obj 的 属性 及 其 值 的 一 个 字典 ; 如 果 没 有 给 出 obj, 
vars () 显示 局 部 名 字 空 间 字 典 《〈 属 性 及 其 值 )， 也 就 是 
locals(). 





a.  Python2.2 中 新 增 ; 仅 对 新 式 类 有 效 





13. 13 用 特殊 方法 定制 类 











我 们 已 在 本 章 前 面部 分 讲解 了 方法 的 两 个 重要 方面 : 首先 ， 方 法 必须 在 调用 前 被 绑 定 〈 到 它们 
相应 类 的 某 个 实例 中 );， 其 次 ， 有 两 个 特殊 方法 可 以 分 别 作为 构造 器 和 析 人 够 器 的 功能 ， 分 别名 为 
init (0 和 del O. 




















FXE, init. 0 和 del 0 只 是 可 自 定 义 特殊 方法 集中 的 一 部 分 。 它 们 中 的 一 些 有 预定 
义 的 默认 行为 ， 而 其 它 一 些 则 没有 ， 留 到 需要 的 时 候 去 实现 。 这 些 特殊 方法 是 Python 中 用 来 扩充 























类 的 强 有 力 的 方式 。 它 们 可 以 实现 : 








e ”模拟 标准 类 型 
@ EREET 





特殊 方法 允许 类 通过 重 载 标准 操作 符 +, *， 甚 至 包括 分 段 下 标 及 映射 操作 操作 [j 来 模拟 标准 
类 型 。 如 同 其 它 很 多 保留 标识 符 ， 这 些 方法 都 是 以 双 下 划 线 ( _) 开始 及 结尾 的 。 表 13.4 列 出 了 所 有 
特殊 方法 及 其 它 的 描述 。 





























表 13.4 用 来 定制 类 的 特殊 方法 











特殊 方法 描述 
基本 定制 型 
C. init (self[, argl, ...]) 构造 器 〈 带 一 些 可 选 的 参数 ) 


C. new (self[, argl, ...])* 构造 器 《〈 带 一 些 可 选 的 参数 ); Wa AEWA AER 














型 的 子 类 。 
C. del (self) 解构 器 
C. str (self) 可 打印 的 字符 输出 ， 内 建 str O € print 语句 
C. repr (self) 运行 时 的 字符 串 输 出 ;内 建 repr 0 和 ““ 操作 符 
C. unicode (self)' Unicode 字符 串 输 出 ; 内 建 unicode () 
—&— 














Edit By Vheavens 


Edit By Vheavens 


+ | t 





. call (self, *args) 表示 可 调用 的 实例 
. nonzero (self) A object Æ X. False f£; NW bool O (M2. 2 版 开始 ) 
. len (self) “长 度 ”( 可 用 于 类 ); 内 建 len () 

















表 13.4 可 以 定制 类 的 特殊 方法 〈 续 ) 



























































特殊 方法 描述 

WE CB) 比较 * 

C. emp (self, obj) 对 象 比 较 ; 内 建 cmp O 

C. 1t (self, obj) and 小 于 /小 于 或 等 于 ， 对 应 《及 《= 操作 符 
C. gt (self, obj) and 大 于 /大 于 或 等 于 ， 对 应 > 及 >= 操 作 符 
C. eq (self, obj) and 等 于 /不 等 于 ， 对 应 ==, !1= 及 《> 操作 符 
属性 

C. getattr (self, attr) 获取 属性 ， 内 建 getattr(); 仅 当 属性 没有 找到 时 调用 
C. setattr (self, attr, val) 设置 属性 

C. delattr (self, attr) 删除 属性 

C. getattribute (self, attr) ° 获取 属性 ;内 建 getattr O; 总 是 被 调用 
C. get (self, attr) ° (描述 符 ) 获取 属性 

C. set (self, attr, val) ° (描述 符 ) 设置 属性 

C. delete: (self, attr) ° (描述 符 ) 删除 属性 
定制 类 /模拟 类 型 

数值 类 型 : 二 进 制 操作 符 

C. add (self, obj) 加 ; + 操作 符 

C. sub (self, obj) Jk. -操作 符 

C. *mul (self, obj) 3E; * 操 作 符 

C. *div (self, obj) ER: /操作 符 

C. x*truediv (self, obj) ° True BR; /操作 符 

C. sxfloordiv (self, obj) ° Floor BR; // 操 作 符 

C. mod (self, obj) 取 模 / 取 余 ;，% 操 作 符 

C. divmod (self, obj) 除 和 取 模 ， 内 建 divmod () 

C. pow (self, obj[, mod]) HF; AVE powO ;** 操 作 符 

C. *lshift (self, obj) 左 移 位 ; 《< 操作 符 





表 13.4 可 定制 类 的 特殊 方法 CH 




















特殊 方法 描述 
定制 类 /模拟 类 型 
数值 类 型 ， 二进制 操作 符 
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C. sxrshift (self, obj) 右 移 ，>> 操 作 符 

C. and (self, obj) 按 位 与 ，& 操 作 符 

C. x*or (self, obj) 按 位 或 ，| 操 作 符 

C.__*xor__(self, obj) 按 位 与 或 ; 操作 符 

数值 类 型 :一 元 操作 符 

C. neg (self) 一 元 负 

C. pos (self) 一 元 下 

C. abs (self) 绝对 值 ， 内 建 absO 

C. invert (self) 按 位 求 反 ; “操作 符 

数值 类 型 : 数值 转换 

C. complex (self, com) FEJ complex (复数 ) ; WN complex () 

C. int (self) 转 为 int; A int (0 

C. long (self) HEJ long; A longO 

C. float (self) EW float; jf float O 

数值 类 型 : 基本 表示 法 (String) 

C. oct (self) 八进制 表示 ; 内 建 oct O 

C. hex (self) 十 六 进 制 表 示 ; 内 建 hex O 

数值 类 型 : 数值 压缩 

C. coerce (self, num) 压缩 成 同样 的 数值 类 型 ， 内 建 coerce O 
四 C. dex. (eel) 在 有 必要 时 , 压缩 可 选 的 数值 类 型 为 整 型 (比如 用 于 切片 E 

索引 等 等 ) 








X 13.4 定制 类 的 特殊 方法 〈 续 ) 








序列 类 型 

C. len (self) 序列 中 项 的 数目 

C. getitem (self, ind) 得 到 单个 序列 元 素 

C. setitem (self, ind, val) 设置 单个 序列 元 素 
C. delitem (self, ind) 删除 单个 序列 元 素 
特殊 方法 描述 

序列 类 型 


C. getslice (self, indl, ind2) 得 到 序列 片断 




















C. setslice (self, il, i2,val) 设置 序列 片断 

C. delslice (self, indl, ind2) 删除 序列 片断 

C. contains (self, val) * 测试 序列 成 员 ; 内 建 in 关键 字 
C. *add (self,obj) 串 连 ，+ 操 作 符 

C. *xmul (self, obj) 重复 ; * 操 作 符 

C. iter (self) ° 创建 迭代 类 ， 内 建 iter O 
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映射 类 型 

C. len (self) mapping 中 的 项 的 数目 

C. hash (self) 散 列 (hash) 函数 值 

C. getitem (self, key) 得 到 给 定 键 (key) 的 值 

C. setitem (self, key, val) 设置 给 定 键 key) 的 值 

C. delitem (self, key) 删除 给 定 键 (key) 的 值 

C. missing (self, key) 给 定 键 如 果 不 存在 字典 中 ， 则 提供 一 个 默认 值 

a. Python 2.2 中 新 引入 ; 仅 用 于 新 式 类 中 。 

b. Python 2.3 中 新 引入 。 

c. 除了 cmpO 外 ， 其 余 全 是 在 Python 新 引入 的 。 

d.  ^* 代表 (selp OP obj), ' r' (obj OP self), BR’ i’ ( 原 位 (in-place) 操 作 ，Py2.0 新 增 )， 
例如 add , | radd , or  iadd 





e. Python 2.2 中 新 引入 。 


f. “x” either nothing (self OP obj), “r” (obj OP self ), or “i” for in-place 


operation (new in Python 1.6), i.e., 


add_, radd , or iadd 





g. Python 2.5 中 新 引入 。 








基本 的 定制 和 对 象 〈 值 ) 比较 特殊 方法 在 大 多 数 类 中 都 可 以 被 实现 ， 且 没有 同 任何 特定 的 类 型 


























实例 属性 。 这 同样 独立 于 模型 。 还 有 一 个 ，_getattribute 0, ， 它 仅 用 在 新 式 类 中 ， 我 们 将 在 后 








面 的 章节 中 对 它 进 行 描述 。 





模型 绑 定 。 延 后 设置 ， 也 就 是 所 谓 的 Rich 比较 ， 在 Python2. 1 中 加 入 。 属 性 组 帮助 管理 您 的 类 的 





特殊 方法 中 数值 类 型 部 分 可 以 用 来 模拟 很 多 数值 操作 ,包括 那些 标准 (一 元 和 二 进 制 ) 操作 符 ， 
类 型 转换 ， 基 本 表示 法 ， 及 压缩 。 也 还 有 用 来 模拟 序列 和 映射 类 型 的 特殊 方法 。 实 现 这 些 类 型 的 特 








殊 方法 将 会 重 载 操作 符 ， 以 使 它们 可 以 处 理 








你 的 类 类 型 的 实例 。 





另外 ， 除 操作 符 ”x*¥truediv OM *floordiv O Æ Python2.2 中 加 入 ， 用 来 支持 Python KR 
操作 符 中 待定 的 更 改 一 -可 查看 5. 5. 3 节 。 基 本 上 ， 如 果 解 释 器 启用 新 的 除法 ， 不 管 是 通过 一 个 开关 
来 启动 Python， 还 是 通过 “from future import division”, 单 斜 线 除 操作 (/) 表示 的 将 是 ture 
除法 ， 意 思 是 它 将 总 是 返回 一 个 浮 点 值 ， 不 管 操作 数 是 否 为 浮 点 数 或 者 整数 (复数 除法 保持 不 变 )。 
双 和 斜 线 除 操作 CO 将 提供 大 家 熟悉 的 浮 点 除法 ， 从 标准 编译 型 语言 像 C/C++ 及 Java 过 来 的 工程 师 























三 | 

















一 定 对 此 非常 熟悉 。 同 样 ， 这 些 方法 只 能 处 理 实现 了 这 些 方法 并 且 司 用 了 新 的 除 操作 的 类 的 那些 符 


Fo 





表格 中 , 在 它们 的 名 字 中 , 用 星 号 通配符 标注 的 数值 二 进 制 操作 符 则 表示 这 些 方法 有 多 个 版 本 ， 
在 名 字 上 有 些许 不 同 。 星 号 可 代表 在 字符 串 中 没有 额外 的 字符 ， 或 者 一 个 简单 的 “r” 指 明 是 一 个 右 

















结合 操作 。 没 有 “r”， 操 作 则 发 生 在 对 于 s 











elf OP obj 的 格式 ;，“r” 的 出 现 表明 格式 obj OP self. 


比如 ， add (self, obj) 是 针对 self*obj 的 调用 ,而 radd (self, obj) 则 针对 ob j*self 来 调用 。 














Edit By Vheavens 


Edit By Vheavens 


ee 
T 


增 量 赋值 ， 起 于 Python 2.0， 介 绍 了 “ 原 位 ”操作 符 。 一 个 “i” 代 替 星 号 的 位 置 ， 表 示 左 结合 
操作 与 赋值 的 结合 ， 相 当 是 在 self-self OP obj。 举 例 ，_iadd (self, obj) 相 当 于 self=selftobj 
的 调用 。 























随 着 Python 2.2 中 新 式 类 的 引入 ， 有 一 些 更 多 的 方法 增加 了 重 载 功能 。 然 而 ， 在 本 章 开 始 部 分 
提 到 过 ， 我 们 仅 关 注 经 典 类 和 新 式 类 都 适应 的 核心 部 分 ， 本 章 的 后 续 部 分 ， 我 们 介绍 新 式 类 的 高 级 
特性 。 








13. 13. 1 简单 定制 (RoundFloat2) 





我 们 的 第 一 个 例子 很 普通 。 在 某 种 程度 上 ， 它 基于 我 们 前 面 所 看 到 的 从 Python 类 型 中 派生 出 的 
派生 类 RoundFloat。 这 个 例子 很 简单 ,事实 上 ,我 们 甚至 不 想 去 派生 任何 东西 (当然 , 除 object Yh)... 
我 们 也 不 想 采 用 与 floats 有 关 的 所 有 “好 东西 ”不 ， 这 次 ， 我 们 想 创建 一 个 苗条 的 例子 ， 这 样 你 
可 以 对 类 定制 的 工作 方式 有 一 个 更 好 的 理解 。 这 种 类 的 前 提 与 其 它 类 是 一 样 的 : 我 们 只 要 一 个 类 来 
保存 浮 点 数 ， 四 舍 五 入 ， 保 留 两 位 小 数位 。 









































class RoundFloatManual (object): 
def init (self, val): 
assert isinstance(val, float), | 
“Value must be a float!” 
self. value = round(val, 2) 


这 个 类 仅 接 收 一 个 浮 点 值 一 一 它 断 言 了 传递 给 构造 器 的 参数 类 型 必须 为 一 个 译 点 数 一 一 并 且 将 
其 保存 为 实例 属性 值 。 让 我 们 来 试 试 ， 创 建 这 个 类 的 一 个 实例 : 











2» rfm = RoundFloatManual (42) 

Traceback (most recent call last): 

File "Xstdin^', line l, in ? 

File “roundFloat2. py/, line 5, in init . 


assert isinstance(val, float), | AssertionError: Value must be a float! 


> rfm = RoundFloatManual (4. 2) 

222 rfm 

<roundFloat2. RoundFloatManual object at 0x63030» 
225^ print rfm 


<roundFloat2. RoundFloatManual object at 0x63030» 














你 已 看 到 ， 它 因 输 入 非法 ， 而 “ 嘻 住 >， 但 如 果 输 入 正确 时 ， 就 没有 任何 输出 了 。 可 是 ， 当 把 这 
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个 对 象 转 存 在 交互 式 解释 器 中 时 ， 看 一 下 发 生 了 什么 。 我 们 得 到 一 些 信息 ， 却 不 是 我 们 要 找 的 。( 我 
们 想 看 到 数值 ， 对 吧 ? ) 调用 print 语句 同样 没有 明显 的 帮助 。 








PERE, print (使 用 str OO 和 真正 的 字符 串 对 象 表 示 〈 使 用 repr OO. 都 没 能 显示 更 多 有 关 
我 们 对 象 的 信息 。 一 个 好 的 办 法 是 ， 去 实现 _str OU repr 0 〇 二 者 之 一 ， 或 者 两 者 都 实现 ， 这 
样 我 们 就 能 “看 到 ”我 们 的 对 象 是 个 什么 样子 了 。 换 句 话 说， 当 你 想 显示 你 的 对 象 ， 实 际 上 是 想 看 
到 有 意义 的 东西 ， 而 不 仅仅 是 通常 的 Python 对 象 字 符 串 (kobject object at id>) 。 让 我 们 来 添加 
一 个 _str() D, 以 覆盖 默认 的 行为 : 























def str (self): 
return str(self. value) 


ERMIR SIBI: 
> rfm = RoundFloatManual (5. 590464) 
225 rfm 


<roundFloat2. RoundFloatManual object at Ox5eff® 
225^ print rfm 
3. 39 

2» rfm = RoundFloatManual (5. 5964) 


225^ print rfm 
a 6 


我 们 还 有 一 些 问题 .. . 一 个 问题 是 仅仅 在 解释 器 中 转 储 (dump) 对 象 时 ， 仍 然 显 示 的 是 默认 对 象 符 
号 ， 但 这 样 做 也 算 不 错 。 如 果 我 们 想 修 复 它 ， 只 需要 履 盖 repr__() 。 因 为 字符 串 表 示 法 也 是 Python 
对 象 ， 我 们 可 以 让 _repr OF str 0 的 输出 一 致 。 
































为 了 完成 这 些 ， 只 要 把 _str (的 代码 复制 给 ”repr O. 。 这 是 一 个 简单 的 例子 ， 所 以 它 没有 
真正 对 我 们 造成 负面 影响 , 但 作为 程序 员 , 你 知道 那 不 是 一 个 最 好 的 办 法 。 如 果 str 0 中 存在 bug, 
那么 我 们 会 将 bug 也 复制 给 repr OT. 




















最 好 的 方案 , E str 0 中 的 代码 也 是 一 个 对 象 , 同 所 有 对 象 一 样 , 引用 可 以 指向 它们 , 所 以 ， 
我 们 可 以 仅仅 让 _repr 0 作为 _str_0 的 一 个 别名 : 


repr — str 





在 带 参数 5. 5964 的 第 二 个 例子 中 ， 我 们 看 到 它 舍 入 值 刚 好 为 5.6， 但 我 们 还 是 想 显示 带 两 位 小 
数 的 数 。 来 玩 玩 一 个 更 好 的 妙计 吧 ， 看 下 面 : 
def str (self): 
return '& 2f % self. value 
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这 里 就 同时 有 具备 str © 和 repr O 的 输出 了 : 
2» rfm = RoundFloatManual (5. 5964) 
>>> rfm 

5. 60 

222^ print rfm 

5. 60 





例 13. 2 基本 定制 CroundFloat2. py) 





1#!/usr/bin/env python 
2 
3class RoundFloatManual (object): 
4def | init (self, val): 
5assert isinstance(val, float), \ 
6 “Value must be a float!’ 

7self. value = round(val, 2) 
8 
9def str (self): 

10 return '& 2f' % self. value 


11 
12 repr = str 


在 本 章 开 始 部 分 ， 最 初 的 RoundFloat 例子 ， 我 们 没有 担心 所 有 细致 对 象 的 显示 问题 ， 原 因 是 
str (和 _ repr_ 0 作为 float 类 的 一 部 分 已 经 为 我 们 定义 好 了 。 我 们 所 要 做 的 就 是 去 继承 它们 。 
增强 版 本 “手册 ”中 需要 另外 的 工作 。 你 发 现 派生 是 多 么 的 有 益 了 吗 ? 我 们 甚至 不 需要 知道 解释 器 
在 继承 树 上 要 执行 多 少 步 才 能 找到 一 个 已 声明 的 你 正在 使 用 却 没 有 考虑 过 的 方法 。 我 们 将 在 例 13. 2 
中 列 出 这 个 类 的 全 部 代码 。 





























现在 开始 一 个 稍 复杂 的 例子 。 


13. 13. 2 数值 定制 (Time60) 














作为 第 一 个 实际 的 例子 ， 我 们 可 以 想象 需要 创建 一 个 简单 的 应 用 ， 用 来 操作 时 间 ， 精 确 到 小 时 
和 分 。 我 们 将 要 创建 的 这 个 类 可 用 来 跟踪 职员 工作 时 间 , ISP 用 户 在 线 时 间 , 数据 库 总 的 运行 时 间 (不 
包括 备份 及 升级 时 的 停机 时 间 )， 在 扑克 比赛 中 玩家 总 时 间 ， 等 等 。 

















在 Time60 类 中 ， 我 们 将 整数 的 小 时 和 分 钟 作为 输入 传 给 构造 器 。 


class Time60 (object): # ordered pair MAFII 
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def | init (self, hr, min): # constructor fA 

self. hr = hr # assign hours AJ BIRA 

self. min = min # assign minutes AIRA 
显示 











同样 ， 如 前 面 的 例子 所 示 ， 在 显示 我 们 的 实例 的 时 候 ， 我 们 需要 一 个 有 意义 的 和 输出， 那么 就 要 
fixi str O (如 果 有 必要 的 话 ， repr O teat) 。 我 们 都 习惯 看 小 时 和 分 ， 用 冒号 分 隔 开 的 
格式 ， 比 如 ,“4:30”， 表 示 四 个 小 时 ， 加 半 个 小 时 《〈4 个 小 时 及 30 分 钟 ): 








def str (self): 
return 'fd:Wd' % (self. hr, self. min) 





用 此 类 ， 可 以 实例 化 一 些 对 象 。 在 下 面 的 例子 中 ， 我 们 局 动 一 个 工时 表 来 跟踪 对 应 构造 器 的 计 
费 小 时 数 : 


2^ mon = Time60(10, 30) 
>>» tue = Time60(11, 15) 
225 


>>> print mon, tue 
10:30 11:15 


输出 不 错 ， 正 是 我 们 想 看 到 的 。 下 一 步 干 什么 呢 ? 可 考虑 与 我 们 的 对 象 进行 交互 。 比 如 在 时 间 
片 的 应 用 中 ， 有 必要 把 Timne60 的 实例 放 到 一 起 让 我 们 的 对 象 执行 所 有 有 意义 的 操作 。 我 们 更 喜欢 像 
这 样 的 : 














222^ mon + tue 
21745 


加 法 





Python 的 重 载 操作 符 很 简单 。 像 加 号 (+)， 我 们 只 需要 重 载 addi 0 〇 方法， 如 果 合 适 ， 还 可 以 
用 radd 0 及 iadd ()。 稍 后 有 更 多 有 关 这 方面 的 描述 。 实 现 _add 0 〇 听 起 来 不 难 一 一 只 要 把 
分 和 小 时 加 在 一 块 。 大 多 数 复杂 性 源 于 我 们 怎么 处 理 这 个 新 的 总 数 。 如 果 我 们 想 看 到 “21:45”， 就 
必须 认识 到 这 是 另 一 个 Time60 对 象 ， 我 们 没有 修改 mon 或 tue， 所 以 ， 我 们 的 方法 就 应 当 创建 另 一 
个 对 象 并 填 入 计算 出 来 的 总 数 。 





























实现 _add 0 特殊 方法 时 ， 首 先 计算 出 个 别 的 总 数 ， 然 后 调用 类 构造 占 返 回 一 个 新 的 对 象 : 





def add (self, other): 
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return self. class (self. hr + other. hr, self. min + other. min) 











和 正常 情况 下 一 样 ， 新 的 对 象 通过 调用 类 来 创建 。 唯 一 的 不 同 点 在 于 ， 在 类 中 ， 你 一 般 不 直接 
调用 类 名 ， 而 是 使 用 self 的 _class 属性 ， 即 实例 化 self 的 那个 类 ， 并 调用 它 。 由 于 
self. class 与 Time60 相同 ， 所 以 调用 self. class 0 与 调用 Time600 是 一 回 事 。 











不 管 怎样 ， 这 是 一 个 更 面 问 对 象 的 方式 。 男 一 个 原因 是 ， 如 果 我 们 在 创建 一 个 新 对 象 时 ， 处 处 
使 用 真实 的 类 名 ， 然 后 ， 决 定 将 其 改 为 别 的 名 字 ， 这 时 ， 我 们 就 不 得 不 非常 小 心地 执行 全 局 搜索 并 
替换 。 如 果 靠 使 用 self. class ， 就 不 需要 做 任何 事情 ， 只 需要 直接 改 为 你 想 要 的 类 名 。 





























好 了 ， 我 们 现在 来 使 用 加 号 重 载 ,“ 增 加 ”Time60 HR: 
22^ mon = Time60(10, 30) 

2» tue = Time60(11, 15) 

222 mon + tue 

«t ime60. Time60 object at 0x62190» 

222 print mon + tue 

21:45 





哎哟 ， 我 们 忘记 添加 一 个 别名 _repr_ A str 了 ， 这 很 容易 修复 。 你 可 能 会 问 ,“ 当 我 们 试 
着 在 重 载 情况 下 使 用 一 个 操作 符 ， 却 没有 定义 相对 应 的 特殊 方法 时 还 有 很 多 需要 优化 和 重要 改良 的 
地 方 ， 会 发 生 什 么 事 昵 ? ” 答案 是 一 个 TypeError 异常 : 























222 mon — tue 

Traceback (most recent call last): File “<stdin>”, line 1, in ? 
TypeError: unsupported operand type(s) for -: 'Time60' 

and 'Time60' 


原 位 加 法 














有 了 增 量 赋值 (在 Python 2. 0 中 引入 ), 我 们 也 许 还 有 希望 履 盖 “ 原 位 "操作, 比如， iadd 0。 
这 是 用 来 支持 像 mon += tue 这 样 的 操作 符 ， 并 把 正确 的 结果 赋 给 mon。 重 载 一 个 ix _0 方 法 的 只 
一 秘密 是 它 必须 返回 self。 把 下 面 的 片断 加 到 我 们 例子 中 ， 以 修复 上 面 的 repr 0 问题 ， 并 支持 增 量 
赋值， 











repr — str 





def | iadd (self, other): 
self. hr += other. hr 
self. min += other. min 
return self 
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下 面 是 结果 输出 : 








22^ mon =Time60 (10, 30) 
2» tue =Time60 (11, 15) 
222 mon 

10:30 

225» id(mon) 

401872 

222 mon += tue 

25» id(mon) 

401872 

222 mon 

21:45 


























注意 ， 使 用 id() 内 建 函 数 是 用 来 确定 一 下 ， 在 原 位 加 的 前 后 ， 我 们 确实 是 修改 了 原来 的 对 象 ， 
而 没有 创建 一 个 新 的 对 象 。 对 一 个 具有 巨大 潜能 的 类 来 说 ， 这 是 很 好 的 开始 。 在 例 13.3 中 给 出 了 
Time60 的 类 的 完全 定义 




















例 13. 3 中 级 定制 (time60. py) 


1 #!/usr/bin/env python 
2 
3class Time60 (object): 
4’ Time60 - track hours and minutes’ 
5 
6 def init (self hr, min): 
7 ’Time60 constructor - takes hours and minutes’ 
8 self. hr = hr 
9 self. min = min 


def str (self): 
’Time60 — string representation’ 


return “%d:%d’ % (self. hr, self. min) 


repr = str 





def add (self, other): 
'Time60 - overloading the addition operator’ 
return self. class (self. hr + other. hr, self. min + other. min) 
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22 def iadd (self, other): 

23 'Time60 - overloading in-place addition’ 
24 self. hr += other. hr 

25 self. min += other. min 

26 return self 


例 13. 4. 随机 序列 迭代 器 (randSeq. py) 


1#!/usr/bin/env python 

2 

3from random import choice 

4 

5class RandSeq (object): 

6 def init (self, seq): 


7 self. data = seq 
8 
9 def iter (self): 
10 return self 
11 
12 def next (self): 
13 return choice (self. data) 
升华 











现在 暂 不 管 它 了 ， 但 在 这 个 类 中 ， 还 有 很 多 需要 优化 和 改良 的 地 方 。 比 如 ， 如 果 我 们 不 传 入 两 
个 分 离 的 参数 ， 而 传 入 一 个 2 值 元 组 给 构造 器 作为 参数 ， 是 不 是 更 好 些 呢 ? 如 果 是 像 “10:30” 这 样 
的 字符 串 的 话 ， 结 果 会 怎样 ? 











答案 是 肯定 的 ， 你 可 以 这 样 做 , 在 Python 中 很 容易 做 到 ， 但 不 是 像 很 多 其 他 面向 对 象 语言 一 样 
通过 重 载 构造 器 来 实现 . Python. 不 允许 用 多 个 签名 重 载 可 调用 对 象 . 所 以 实现 这 个 功能 的 唯一 的 方式 
是 使 用 单一 的 构造 器 ， 并 由 isinstance O 和 (可 能 的 )type O 内 建 函 数 执行 自省 功能 。 








能 支持 多 种 形式 的 输入 ， 能 够 执行 其 它 操作 像 减法 等 ， 可 以 让 我 们 的 应 用 更 健壮 ， 灵 活 。 当 然 
这 些 是 可 选 的 ， 就 像 “ 重 糕 上 的 冰 ”， 但 我 们 首先 应 该 担心 的 是 两 个 中 等 程度 的 缺点 : 1. 当 比 十 分 钟 
还 少时 ， 格 式 并 不 是 我 们 所 希望 的 ，2.， 不 文 持 60 进 制 (基数 60) 的 操作 : 

















22» wed = Time60(12, 5) 
225 wed 
12:5 





$— 一 * 一 
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»» thu = Time60(10, 30) i 
2M» fri = Time60(8, 45) 


225 thu + fri 
18:75 











1. 源 自 拉丁 语 的 基数 是 60 的 名 字 ; 有 时 ， 六 十 进 制 会 被 用 到 ， 这 是 一 种 希腊 词根 “hexe” 和 拉 
本 “gesmal” 的 混合 。 











显示 wed 结果 是 “12:05”， 把 thu 和 fri 加 起 来 结果 会 是 “19:15”。 修 改 这 些 缺 陷 ， 实 现 上 面 
的 改进 建议 可 以 实际 性 地 提高 你 编写 定制 类 技能 。 这 方面 的 更 新 ， 更 详细 的 描述 在 本 章 的 练习 13. 20 
中 。 























我 们 希望 ， 你 现在 对 于 操作 符 重 载 ， 为 什么 要 使 用 操作 符 重 载 ， 以 及 如 何 使 用 特殊 方法 来 实现 
它 已 有 了 一 个 更 好 的 理解 了 。 接 下 来 为 选 看 章节 内 容 ， 让 我 们 来 了 解 更 多 复杂 的 类 定制 的 情况 。 














13.13.3 ”迭代 器 (RandSeq 和 AnyIter) 


RandSeq 


. 我 们 正式 介绍 迭代 器 是 在 第 8 章 ， 但 在 全 书 中 都 在 用 它 。 它 可 以 一 次 一 个 的 遍历 序列 (或 者 是 . 
类 似 序列 对 象 ) 中 的 项 。 在 第 8 章 中， 我们 描述 了 如 何 利用 一 个 类 中 的 _iter 0 和 next 0 方法 ， 
来 创建 一 个 迭代 器 。 我 们 在 此 展示 两 个 例子 。 




















第 一 个 例子 是 RandSeq CRANDom SEQuence 的 缩写 )。 我 们 给 我 们 的 类 传 入 一 个 初始 序列 ， 然 后 
让 用 户 通过 next O EER (TCH). 


init (方法 执行 前 述 的 赋值 操作 。__iter _() 仅 返回 self， 这 就 是 如 何 将 一 个 对 象 声 明 为 
迭代 器 的 方式 ,最 后 ,调用 next () 来 得 到 友 代 器 中 连续 的 值 。 这 个 迭代 器 唯一 的 亮点 是 它 没有 终点 。 

















这 个 例子 展示 了 一 些 我 们 可 以 用 定制 类 色 代 器 来 做 的 与 众 不 同 的 事情 。 一 个 是 无 穷 狗 代 。 因 为 
我 们 无 损 地 读 取 一 个 序列 , 所 以 它 是 不 会 越界 的 。 每 次 用 户 调用 next OI, 它 会 得 到 下 一 个 迭代 值 ， 
但 我 们 的 对 象 永远 不 会 引发 StopIteration 异常 。 我 们 来 运行 它 ， 将 会 看 到 下 面 的 输出 : 








222 from randseq import fandSeq 

22^ for eachItem in RandSeq( 
(rock’, 'paper', 'scissors')): 
print eachItem 


SCÍSSOLS 
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SCÍSSOLS 





rock 
paper 
paper 
SCISSOLS 


例 13. 5 FERRITE RAS CanyIter. py) 


1 #!/usr/bin/env python 
2 
3 class AnylIter (object): 
4 def init (self, data, safe-False): 
Ü self. safe = safe 
6 self. iter = iter (data) 
7 
8 def iter (self): 
9 return self 
10 
11 def next (self, howmany=1): 
12 retval = [] 
13 for eachItem in range (howmany) : 
14 try: 
15 retval. append (self. iter. next ()) 
16 except Stoplteration: 
17 if self. safe: 
18 break 
19 else: 
20 raise 
21 return retval 
Anylter 





在 第 二 个 例子 中 ， 我 们 的 确 创建 了 一 个 迭代 器 对 象 ， 我 们 传 给 next 0 方法 一 个 参数 ， 控 制 返回 
条 目的 数目 ， 而 不 是 去 一 次 一 个 地 和 欠 代 每 个 项 。 下 面 是 我 们 的 代码 (ANY number of items ITERator): 








和 RandSeq 类 的 代码 一 样 ， 类 AnyIter 很 容易 领会 。 我 们 在 上 面 描述 了 基本 的 操作 .. . 它 同 其 它 
迭代 器 一 样 工 作 ， 只 是 用 户 可 以 请 求 一 次 返回 N 个 迭代 的 项 ， 而 不 仅 是 一 个 项 。 








我 们 给 出 一 个 迭代 器 和 一 个 安全 标识 符 (safe) 来 创建 这 个 对 象 。 如 果 这 个 标识 符 (safe) NA 
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(True) ， 我 们 将 在 遍历 完 这 个 迭代 器 前 ， 返 回 所 获取 的 任意 条 目 ， 但 如 果 这 个 标识 符 为 假 (False) , 
则 在 用 户 请 求 过 多 条 目 时 ， 将 会 引发 一 个 异常 。 错 综 复 杂 的 核心 在 于 next), ， 特 别 是 它 如 何 退 出 的 
(14-21 行 ) 。 

















在 next 0 的 最 后 一 部 分 中 ， 我 们 创建 用 于 返回 的 一 个 列表 项 ， 并 且 调 用 对 象 的 next 0 方法 来 获 
得 每 一 项 条 目 ,如 果 我 们 遍历 完 列表 ,得 到 一 个 StopIteration 异常 ,这 时 则 检查 安全 标识 符 safe). 
如 果 不 安 全 ( 即 ，self. safe=False) ， 则 将 异常 抛 还 给 调用 者 (raise); 否则 ， 退 出 (break) 并 返回 
(return) 已 经 保存 过 的 所 有 项 。 








22^ a = AnyIter (range (10)) 
2 i = iter@) 

2» for j in range(l, 5): 
2^ print  ':, i. next (j) 


1 : [0] 

ZrIJL 2) 
Fedo. dB 
4: [6 7 8 9] 





Eit EE ZIRA lal, AEE A GPSS. ST ne, RREA? 
让 我 们 首先 试 试 “ 不 安全 (unsafe) ”的 模式 ， 这 也 就 是 紧 随 其 后 创建 我 们 的 迭代 器 : 











2 i = iter(a) 
2 i. next (14) 
Traceback (most recent call last): 
File “stdin, line L in ? 
File ’anylIter. py”, line 15, in next retval. append (self. iter. next ()) 
Stoplteration 





因为 超出 了 项 的 支持 量 ， 所 以 出 现 了 StopIteration 异常 ， 并 且 这 个 异常 还 被 重新 引发 回调 用 
者 (第 20 行 )。 如 果 我 们 使 用 “安全 (safe)” 模 式 重 建 沈 代 器 ， 再 次 运行 一 次 同一 个 例子 的 话 ， 我 
们 就 可 以 在 项 失控 出 现 前 得 到 碗 代 器 所 得 到 的 元 素 : 





























22> a = AnyIter(range(10), True) 
2 i = iter(a) 

2 i. next (14) 

[0, 3.3545 4 5 6 7 8 9 


13.13.4 * 多 类 型 定制 (NumStr) 


E 











[e— 一 * 一 
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现在 创建 男 一 个 新 类 ，Num 
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Str， 由 一 个 数字 -字符 对 组 成 ， 相 应 地 ， 记 为 n 和 s， 数 值 类 型 使 用 


整 型 (integer)。 尺 管 这 组 顺序 对 的 “合适 的 ”记号 是 (n,s)， 但 我 们 选用 [n: :sj 来 表示 它 ， 有 点 
不 同 。 暂 不 管 记 号 ， 这 两 个 数据 元 素 只 要 我 们 模型 考虑 好 了 ， 就 是 一 个 整体 。 可 以 创建 我 们 的 新 类 
TY, Oke NumStr， 有 下 面 的 特征 : 











初始 化 














类 应 当 对 数字 和 字符 串 进行 初始 化 ;如果 其 中 一 个 (或 两 ) 没有 初始 化 ， 则 使 用 0 和 空 字 符 串 ， 








也 就 是 , n=0 H s=“”， 作 为 默认 


加 法 





o 











我 们 定义 加 法 操作 符 ， 功 能 是 把 数字 加 起 来 ， 把 字符 连 在 一 起 ;要 点 部 分 是 字符 串 要 按 顺 序 相 








其 中 ， 十 代表 数字 相 加 及 字符 相 


乘法 








XE. EU, NumStrl-2[nl::s1] H NumStr2— [n2::s2]. M] NumStrl+NumStr2 表示 [nl4^n2::s1-*s2], 





日 连接 。 


类 似 的 ， 定 义 乘法 操作 符 的 功能 为 ， 数 字 相 乘 ， 字符 累积 相连 ， 也 就 是 ， 





NumStr1*NumStr2=[nl*n: :sl* 
False 值 





n]. E 





当 数 字 的 数值 为 0 BET 


比较 





为 空 时 ， 也 就 是 当 NumStr=[0::’’ JIN, 这 个 实体 即 有 一 个 false f. 





比较 一 对 NumStr 对 象 , 比如 ，[nl: :sl] vs. [n2::s2], 我 们 可 以 发 现 九 种 不 同 的 组 合 ( 即 , n1>n2 
and sl<s2, nl==n2 and s1>s2， 等 等 ) 。 对 数字 和 字符 串 ， 我 们 一 般 按 照 标准 的 数值 和 字典 顺 
序 的 进行 比较 ， 即 ， 如 果 objlkopbj2， 普 通 比较 cmp (obj1, obj2) 的 返回 值 是 一 个 小 于 0 的 整数 ， 当 
objl>obj2 时 ， 比 较 的 返回 值 大 于 0， 当 两 个 对 象 有 相同 的 值 时 ， 比 较 的 返回 值 等 于 0。 











我 们 的 类 的 解决 方案 是 把 这 些 值 相 加 ， 然 后 返回 结果 。 有 趣 的 是 cmp) 不 会 总 是 返回 -1，0， 或 








1。 上 面 提 到 过 ， 它 是 一 个 小 于 








为 了 能 够 正确 的 比较 对 象 ， 








， 等 于 或 大 于 0 的 整数 。 





我 们 需要 让 _cmp 0 在 (n1>n2) H. (sl>s2) 时 ， 返 回 1, 在 (nl<n2) 





且 (sl1ks2) 时 ， 返 回 -1， 而 当 数 值 和 字符 串 都 一 样 时 ， 或 是 两 个 比较 的 结果 正 相 反 时 ( 即 (n1«n2) AL 
(sl>s2), 或 相反 ) ， 返 回 0. 反之 亦 然 。 





例 13.6 多 类 型 类 定制 Cnumstr. py) 
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1 #!/usr/bin/env python 

2 

3 class NumStr (object): 

4 

5def init (self, num=0, string- '): 


6 self. num = num 


a self. string = string 





8 
9def str (self): # define for str 
10 return /Mo :: fr] % | 
24 self. num, self. string) 
12 repr = str 
13 
14 def add (self, other): # define for sto 
15 If isinstance(other, NumStr): 
16 return self. class (self. num + | 
17 other. num, | 
18 self. string + other. string) 
19 else: 
20 raise TypeError, | 
21 ’ Illegal argument type for built-in operation’ 
22 
23 def mul (self, num): # define for o*n 
24 if isinstance(num, int): 
en return self. class (self. num * num 
26 self. string * num) 
27 else: 
28 raise TypeError, | 
29 'Illegal argument type for built-in operation’ 
30 
3I def  nonzero (self): # False if both are 
32 return self. num or len(self. string) 
33 
34 def | norm cval(self, cmpres):# normalize cmp(Q 
35 return cmp(cmpres, 0) 
36 
37 def cmp (self, other): # define for cmp() 
38 return self. norm cval ( 


cmp(self. num, other.  num)) + | 
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40 self. norm cval( 
4] cmp (self. string, other. string)) 





根据 上 面 的 特征 ， 我 们 列 出 numstr. py 的 代码 ， 执 行 一 些 例子 : 


>>» a = NumStr(3, 'foo') 
2» b = NumStr (8, goo’) 
2M» c = NumStr(2, ’ foo’) 
2» d = NumStr Q 

2» e = NumStr(string- boo’) 
2» f = NumStr (1) 

22^ a 

/3 :+ "foo J 


22^ b 

/3 22 Vago 
222 c 

[2 22 fup 
255 d 
irs 

2225 e 

[0 2% “boo jf 
222 

AL By 
>a vb 

True 
>be 
False 
22^a == a 

True 
>») b * 2 

[6 :: 'googoo' ] 
> a * 3 

[9 :: 'foofoofoo' J 
> b te 

[3 :: 'gooboo! ] 
> et b 

[3 :: 'boogoo' ] 
25» if d: 'not false’ # also bool (d) 
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>» if e: "not false’ # also bool (e) 





'not false’ 
222 cmp (a, b) 
=] 

225» cmp (a, c) 
1 

2252 cmp (a, a) 
0 


逐 行 解释 
第 1-1 行 


脚本 的 开始 部 分 为 构造 器 _init 上 O， 通 过 调用 NumStr () 时 传 入 的 值 来 设置 实例 ， 完 成 自身 初 
始 化 。 如 果 有 参数 缺失 ， 属 性 则 使 用 false 值 ， 即 默认 的 0 或 空 字符 ， 这 取决 于 参数 情况 。 




















一 个 重要 怪癖 是 命名 属性 时 ， 双 下 划 线 的 使 用 。 我 们 在 下 一 节 中 会 看 到 ， 这 是 在 信息 隐藏 时 ， 
强加 一 个 级 别 ， 尽 管 不 够 成 熟 。 程 序 员 导入 一 个 模块 时 ， 就 不 能 直接 访问 到 这 些 数 据 元 素 。 我 们 正 
试 着 执行 一 种 00 设计 中 的 封装 特性 ， 只 有 通过 存 取 函数 才能 访问 。 如 果 这 种 语法 让 你 感觉 有 点 怪 

异 ， 不 舒服 的 话 ， 你 可 以 从 实例 属性 中 删除 所 有 双 下 划 线 ， 程 序 同 样 可 以 良好 地 运行 。 E 



































MABI FRR CO 开始 的 属性 都 被 “混淆 ”(mangled) 了 ， 导 致 这 些 名 字 在 程序 运行 时 
很 难 被 访问 到 。 但 是 它们 并 没有 用 一 种 难于 被 逆向 工程 的 方法 来 “混淆 ”。 事 实 上 ,“ 混 消 ” 属 性 的 
方式 已 众所周知 ， 很 容易 被 发 现 。 这 里 主要 是 为 了 防止 这 些 属性 在 被 外 部 模块 导入 时 ， 由 于 被 意外 
使 用 而 造成 的 名 字 冲 突 。 我 们 将 名 字 改 成 含有 类 名 的 新 标志 符 ， 这 样 做 ， 可 以 确保 这 些 属性 不 会 被 
Tom “Wi”. 更 多 信息 ， 请 参见 13. 14 节 中 关于 私有 成 员 的 内 容 。 



























































第 9-12 行 

我 们 把 顺序 对 的 字符 串 表示 形 式 确定 为 “ [num: :” str ]” 这 样 不 论 我 们 的 实例 用 str () 还 是 包 
EE print 语句 中 时 候 ， 我 们 都 可 以 用 _str 0 〇 来 提供 这 种 表示 方式 。 我 们 想 强 调 一 点 ， 第 二 个 元 
素 是 一 个 字符 串 , 如 果 用 户 看 到 由 引号 标记 的 字符 串 时 , 会 更 加 直观 。 要 做 到 这 点 , 我 们 使 用 “repr O " 
表示 法 对 代码 进行 转换 ， 把 “%s ”替换 成 “%r”。 这 相当 于 调用 repr 0) 或 者 使 用 单反 引号 来 给 出 字符 
串 的 可 求 值 版 本 一 可 求 值 版 本 的 确 要 有 引号 : 





















































25^ print a 
/3 :: uua 
如 果 在 self. string 中 没有 调用 repr 0 (去 掉 单 反 引 号 或 使 用 “%s”) 将 导致 字符 串 引 号 于 
失 : 


return ’[%d :: %s/° % (self. num, self. string) 
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现在 对 实例 再 次 调用 print, AR: 
25^ print a 
/3 ef foo] 





d 





没有 引号 ， 看 起 来 会 如 何 呢 ? 不 能 信服 “foo” 是 一 个 字符 串 ， 对 吧 ? 它 看 起 来 更 像 一 个 变量 。 
连作 者 可 能 也 不 能 确定 。( 我 们 快 点 悄悄 回 到 这 一 变化 之 前 ， 假 装 从 来 没 看 到 这 个 内 容 。) 


























代码 中 _str 0 函数 后 的 第 一 行 是 把 这 个 函数 赋 给 男 一 个 特殊 方法 名 ，__repr 。 我 们 决定 我 
们 的 实例 的 一 个 可 求 值 的 字符 串 表 示 应 当 与 可 打印 字符 串 表 示 是 一 样 的 。 而 不 是 去 定义 一 个 完整 的 
Bree, KA str 0 的 副本 ， 我 们 仅 去 创建 一 个 别名 ,复制 其 引用 。 当 你 实现 _str 0 后 , 一 
旦 使 用 那个 对 象 作为 参数 来 应 用 内 建 str O 函数 , 解释 器 就 会 调用 这 段 代码 .对 repr. 0 及 repr () 
也 一 样 。 























如 果 不 去 实现 _repr QO， 我 们 的 结果 会 有 什么 不 同 呢 ? 如 果 赋 值 被 取消 ， 只 有 调用 str0 的 
print 语句 才 会 显示 对 象 的 内 容 。 而 可 求 值 字符 串 表 示 恢 复 成 默认 的 Python 标准 形式 


<... some object  information...? 














2 print a# calls str(a) 
/3 :+ "too 7s 


2»? a # calls repr (a) 
NumStr. NumStr instance at 122640» 


第 14-21 行 

我 们 想 加 到 我 们 的 类 中 的 一 个 特征 就 是 加 法 操作 ， 前 面 已 提 到 过 。Python 用 于 定制 类 的 特征 之 
一 是 , 我 们 可 以 重 载 操 作 符 ， 以 使 定制 的 这 些 类 型 更 “实用 ”。 调用 一 个 函数 , 像 “add(obj1, obj2) " 
是 为 “add” 对 象 objl 和 ojb2， 这 看 起 来 好 像 加 法 ， 但 如 果 能 使 用 加 号 (+) 来 调用 相同 的 操作 是 不 是 
BASES Me? 像 这 样 ，objl+obj2。 

















重 载 加 号 ， 需 要 去 为 self (SELF) 和 其 它 操作 数 实现 (OTHER) add O. add 0 函数 考 上 处 
Self+Other 的 情况 ， 但 我 们 不 需要 定义 _radd 0 来 处 理 0ther+Self， 因 为 这 可 以 由 Other 的 
add 0 〇 去 考虑 。 数 值 加 法 不 像 字 符 串 那样 结果 受到 (操作 数 ) 顺 序 的 影响 . 



































加 法 操作 把 两 个 部 分 中 的 每 一 部 分 加 起 来 ， 并 用 这 个 结果 对 形成 一 个 新 的 对 象 一 一 通过 将 结 
做 为 参数 调用 self. class 0 来 实例 化 (同样 , 在 前 面 已 解释 过 ) . 磁 到 任何 类 型 不 正确 的 对 象 时 ， 
我 们 会 引发 一 个 TypeError 异常 . 


第 23-29 行 

我 们 也 可 以 重 载 星 号 [ 靠 实现 _mul _() ]， 执 行 数 值 乘法 和 字符 串 重 复 ， 并 同样 通过 实例 化 来 创 
建 一 个 新 的 对 象 。 因 为 重复 只 允许 整数 在 操作 数 的 右边 ， 因 此 也 必 执 行 此 规则 。 基 于 同样 的 原因 ， 
我 们 在 此 也 没有 实现 _rmul _ 0. 
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第 31-32 fT 

Python 对 象 任 何 时 候 都 有 一 个 Boolean 值 。 对 标准 类 型 而 言 ， 对 象 有 一 个 false 值 的 情况 为 : 
它 是 一 个 类 似 于 0 的 数值 ， 或 是 一 个 空 序列 ， 或 者 映射 。 就 我 们 的 类 而 言 ， 我 们 选择 数值 必须 为 0, 
字符 串 要 为 空 作为 一 个 实例 有 一 个 false EWR. Eu nonzero 0 方法 ， 就 是 为 此 目的 。 其 
它 对 象 ， 像 严格 模拟 序列 或 映射 类 型 的 对 象 ， 使 用 一 个 长 度 为 0 作为 false 值 。 这 些 情况 ， 你 需要 
实现 len 0 方法 ， 以 实现 那个 功能 。 


























第 34-41 fT 

. norm cval() (“normalize — cmpO value 的 缩写 ”) 不 是 一 个 特殊 方法 。 它 是 一 个 帮助 我 们 
ER cmp “0 的 助手 函数 :唯一 的 目的 就 是 把 emp 0 返回 的 正 值 转 为 1， 负 值 转 为 -1。cmp () 基于 比 
较 的 结果 , 通常 返回 任意 的 正 数 或 负数 (或 0) , 但 为 了 我 们 的 目的 , 需要 严格 规定 返回 值 为 -1,0 和 1。 
对 整数 调用 emp O 及 与 0 比较 ， 结 果 即 是 我 们 所 需要 的 ， 相 当 于 如 下 代码 片断 : 

















def | norm cval (self, cmpres): 
if cmpres < 0: 
return -1 
elif cmpres > 0: 
return 1 


else: 
return 0 


两 个 相似 对 象 的 实际 比较 是 比较 数字 ， 比 较 字 符 串 ， 然 后 返回 这 两 个 比较 结果 的 和 。 





13. 14 私有 化 


默认 情况 下 ， 属 性 在 Python 中 都 是 “public”， 类 所 在 模块 和 导入 了 类 所 在 模块 的 其 他 模块 的 
代码 都 可 以 访问 到 。 很 多 00 语言 给 数据 加 上 一 些 可 见 性 ， 只 提供 访问 函数 来 访问 其 值 。 这 就 是 熟知 
的 实现 隐藏 ， 是 对 象 封装 中 的 一 个 关键 部 分 。 


























大 多 数 00 语言 提供 “访问 控制 符 ” 来 限定 成 员 函 数 的 访问 。 





双 下 划 线 (_ ) 

Python 为 类 元 素 (属性 和 方法 ) 的 私有 性 提供 初步 的 形式 。 由 双 下 划 线 开始 的 属性 在 运行 时 被 
混淆 ”， 所 以 直接 访问 是 不 允许 的 。 实 际 上 ， 会 在 名 字 前 面 加 上 下 划 线 和 类 名 。 比 如 ， 以 例 
13. 6 (numstr. py) 中 的 self. num 属性 为 例 ， 被 “混淆 ”后 ， 用 于 访问 这 个 数据 值 的 标识 就 变 成 了 
self. NumStr num。 把 类 名 加 上 后 形成 的 新 的 “混淆 ”结果 将 可 以 防止 在 祖先 类 或 子孙 类 中 的 同名 
冲突 。 

尽管 这 样 做 提供 了 某 种 层次 上 的 私有 化 ， 但 算法 处 于 公共 域 中 并 且 很 容易 被 “击败 ”这 更 多 的 
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是 一 种 对 导入 源 代码 无 法 获得 的 模块 或 对 同一 模块 中 的 其 他 代码 的 保护 机 制 |. 





这 种 名 字 混 淆 的 另 一 个 目的 , 是 为 了 保护 _XXX 变量 不 与 父 类 名 字 空 间 相 冲 突 。 如 果 在 类 中 有 一 
个 XXX 属性 ， 它 将 不 会 被 其 子 类 中 的 ”XXX 属性 覆盖 。 (回忆 一 下 ， 如 果 父 类 仅 有 一 个 XXX 属性 ， 
子 类 也 定义 了 这 个 ,这 时 , THI XXX 就 是 覆盖 了 父 类 的 XXX， 这 就 是 为 什么 你 必须 使 用 PARENT. XXX 
来 调用 父 类 的 同名 方法 。) “使 用 _XXX， 子 类 的 代码 就 可 以 安全 地 使 用 _XXX， 而 不 必 担 心 它 会 影响 
到 父 类 中 的 _ XXX。 

















PW C) 














与 我 们 在 第 十 二 章 发 现 的 那样 ， 简 单 的 模块 级 私有 化 只 需要 在 属性 名 前 使 用 一 个 单 下 划 线 字符 。 
这 就 防止 模块 的 属性 用 “from mymodule import *” 来 加 载 。 这 是 严格 基于 作用 域 的 ， 所 以 这 同样 
适合 于 函数 。 

















在 Python 2.2 中 引进 的 新 式 类 ， 增 加 了 一 套 全 新 的 特征 ， 让 程序 员 在 类 及 实例 属性 提供 保护 
的 多 少 上 拥有 大 量 重 要 的 控制 权 。 尽 管 Python 没有 在 语法 上 把 private, protected, friend 或 
protected friend 等 特征 内 建 于 语言 中 ， 但 是 可 以 按 你 的 需要 严格 地 定制 访问 权 。 我 们 不 可 能 涵盖 
所 有 的 内 容 ， 但 会 在 本 章 后 面 给 你 一 些 有 关 新 式 类 属性 访问 的 建议 。 


$ 13.15 XA E 


13.15.1 包装 















































“包装 ”在 Python 编程 世界 中 经 常会 被 提 到 的 一 个 术语 。 它 是 一 个 通用 的 名 字 ， 意 思 是 对 
个 已 存在 的 对 象 进行 包装 ， 不 管 它 是 数据 类 型 ， 还 是 一 段 代 码 ， 可 以 是 对 一 个 已 存在 的 对 象 ， 增 加 
新 的 ， 删 除 不 要 的 ， 或 者 修改 其 它 已 存在 的 功能 。 














在 Python 2.2 版 本 前 ， 从 Python 标准 类 型 子 类 化 或 派生 类 都 是 不 允许 的 。 即 使 你 现在 可 以 对 
新 式 类 这 样 做 ， 这 一 观念 仍然 很 流行 。 你 可 以 包装 任何 类 型 作为 一 个 类 的 核心 成 员 ， 以 使 新 对 象 的 
行为 模仿 你 想 要 的 数据 类 型 中 已 存在 的 行为 ， 并 且 去 掉 你 不 希望 存在 的 行为 ， 它 可 能 会 要 做 一 些 额 
外 的 事情 。 这 就 是 “包装 类 型 ”。 在 附录 中 ， 我 们 还 将 讨论 如 何 扩 充 Python， 包 装 的 另 一 种 形式 。 























包装 包括 定义 一 个 类 ， 它 的 实例 拥有 标准 类 型 的 核心 行为 。 换 名 话说， 它 现 在 不 仅 能 唱 能 跳 ， 
还 能 够 像 原 类 型 一 样 步行 ， 说 话 。 图 15-4 举例 说 明了 在 类 中 包装 的 类 型 看 起 像 个 什么 样子 。 在 图 的 
中 心 为 标准 类 型 的 核心 行为 ， 但 它 也 通过 新 的 或 最 新 的 功能 ， 甚 至 可 能 通过 访问 实际 数据 的 不 同方 


法 得 到 提高 。 
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类 对 象 ( 其 表现 像 类 型 ) 


你 还 可 以 包装 类 ， 但 这 不 会 有 太 多 的 用 途 ， 因 为 已 经 有 用 于 操作 对 象 的 机 制 ， 并 且 在 上 面 己 描 
述 过 ， 对 标准 类 型 有 对 其 进行 包装 的 方式 。 你 如 何 操作 一 个 已 存 的 类 ， 模 拟 你 需要 的 行为 ， 删 除 你 
不 喜欢 的 ， 并 且 可 能 让 类 表现 出 与 原 类 不 同 的 行为 呢 ? 我 们 前 面 已 讨论 过 ， 就 是 采用 派生 。 











Customization Wrapper 


Standard Type 





13-4 包装 类 型 


13.15.2 ”实现 授权 





授权 是 包装 的 一 个 特性 ， 可 用 于 简化 处 理 有 关 dictating 功能 ， 采 用 已 存在 的 功能 以 达到 最 大 
限度 的 代码 重用 。 





包装 一 个 类 型 通常 是 对 已 存在 的 类 型 的 一 些 定制 。 我 们 在 前 面 提 到 过 ， 这 种 做 法 可 以 新 建 ， 修 
改 或 删除 原 有 产品 的 功能 。 其 它 的 则 保持 原样 ， 或 者 保留 己 存 功能 和 行为 。 授 权 的 过 程 ， 即 是 所 有 
更 新 的 功能 都 是 由 新 类 的 茶 部 分 来 处 理 ， 但 已 存在 的 功能 就 授权 给 对 象 的 默认 属性 。 














—= 














实现 授权 的 关键 点 就 是 覆盖 _getattr_ 0 方法 ， 在 代码 中 包含 一 个 对 getattr O AE R ZH Vd 
用 。 特 别 地 ， 调 用 getattr O 以 得 到 默认 对 象 属性 (数据 属性 或 者 方法 ) 并 返回 它 以 便 访问 或 调用 。 
特殊 方法 ”getattr (的 工作 方式 是 , 当 搜 索 一 个 属性 时 , 任何 局 部 对 象 首先 被 找到 (定制 的 对 象 )。 
如 果 搜 索 失 败 了 ， 则 _ getattr_ 0 会 被 调用 ， 然 后 调用 getattr 0 得 到 一 个 对 象 的 默认 行为 。 

















换言之 ， 当 引用 一 个 属性 时 ，Python 解释 器 将 试 着 在 局 部 名 称 空间 中 查找 那个 名 字 ， 比 如 一 个 
自 定义 的 方法 或 局 部 实例 属性 。 如 果 没 有 在 局 部 字典 中 找到 ， 则 搜索 类 名 称 空间 ， 以 防 一 个 类 属性 
被 访问 。 最 后 ， 如 果 两 类 搜索 都 失败 了 ， 搜 索 则 对 原 对 象 开始 授权 请 求 ， 此 时 ， — getattr 0 会 被 
调用 。 




















包装 对 象 的 简 例 





看 一 个 例子 。 这 个 类 已 乎 可 以 包装 任何 对 象 ， 提 供 基 本 功能 ， 比 如 使 用 repr 0 和 str () 来 处理 
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字符 串 表 示 法 。 另 外 定制 由 get (方法 处 理 ， 它 删除 包装 并 且 返 回 原 台 对 象 。 所 以 保留 的 功能 都 授权 
给 对 象 的 本 地 属性 ， 在 必要 时 ， 可 由 getattr 0 获得 。 




















下 面 是 包装 类 的 例子 : 


class WrapMe (object): 
def init (self, obj): 
self. data = obj 
def get (self): 
return self. data 
def repr (self): 
return ‘self. data ‘ 
def . stk. (self): 
return str(self. data) 
def  getattr (self, attr): 
return getattr(self. data, attr) 





在 第 一 个 例子 中 , 我 们 将 用 到 复数 , 因为 所 有 Python 数值 类 型 ， 只 有 复数 拥有 属性 : 数据 属性 ， 
及 conjugate O 内 建 方法 〈 求 共 斩 复 数 ， 译 者 注 1)。 记 住 ， 属 性 可 以 是 数据 属性 ， 还 可 以 是 函数 或 





























2» wrappedComplex = WrapMe (3. 5+4. 2j) 
>>> wrappedComplex # wrapped object: repr GHIR: reprQ 
(3. 5*4. 2j) 
2» mwrappedComplex.real # real attribute ZAJA HE 
d. I 


22^ wrappedComplex. imag # imaginary attribute JERKS TE 
42. 2 


22^ wrappedComplex. conjugate) # conjugate() method conjugate 0 Zr£ 
(3. 5-4. 2j) 

>>> wrappedComplex.get() £ actual object ERIR 

(3. 5+4. 2 7) 














一 旦 我 们 创建 了 包装 的 对 象 类 型 , 只 要 由 交互 解释 器 调用 repr O ,就 可 以 得 到 一 个 字符 串 表 示 。 
然后 我 们 继续 访问 了 复数 的 三 种 属性 ， 我 们 的 类 中 一 种 都 没有 定义 。 在 例子 中 ， 寻 找 实 部 ， 虚 部 及 
than BVA EL... they are not there! 



































对 这 些 属 性 的 访问 ， 是 通过 getattr 0 方法 ， 授 权 给 对 象 ， 最终 调用 get O 方法 没有 授权 ， 因 为 
它 是 为 我 们 的 对 象 定义 的 一 一 它 返 回 包 闭 的 真实 的 数据 对 象 。 


E 
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下 一 个 使 用 我 们 的 包装 类 的 例子 用 到 一 个 列表 。 我 们 将 会 创建 对 象 ， 然 后 执行 多 种 操作 ， 每 次 
授权 给 列表 方法 。 














2» wrappedList = WrapMe([123, 'foo', 45. 67]) 
22» wrappedList. append ( bar’) 
2^» wrappedList. append (123) 

222 wrappedList 

(123. "foo, 45.67, "har, 123] 
2^» wrappedList. index (45. 67) 

2 

2^» wrappedList. count (123) 

Z 

2^» wrappedList. pop 0 

123 

222 wrappedList 

[123, 'foo', 45.67, '"bar'j 




















注意 , 尽管 我 们 正在 我 们 的 例子 中 使 用 实例 , 它们 展示 的 行为 与 它们 包装 的 数据 类 型 非常 相似 。 
然后 ， 需 要 明白 ， 只 有 已 存在 的 属性 是 在 此 代码 中 授权 的 。 











特殊 行为 没有 在 类 型 的 方法 列表 中 ， 不 能 被 访问 ， 因 为 它们 不 是 属性 。 一 个 例子 是 ， 对 列表 的 
切片 操作 , 它 是 内 建 于 类 型 中 的 , 而 不 是 像 append 0) 方法 那样 作为 属性 存在 的 。 从 另 一 个 角度 来 说 ， 
切片 操作 符 是 序列 类 型 的 一 部 分 ， 并 不 是 通过 ”getitem 0 特殊 方法 来 实现 的 。 




















2^» wrappedList[3] 

Traceback (innermost last): File “<stdin>”, line L in ? 
File “wrapme. py”, line 21, in  getattr - 

return getattr(self. data, attr) 

AttributeError: | getitem - 





AttributeError 异常 出 现 的 原因 是 切片 操作 调用 了 getitem 0 方法 ， 且 getitme OKA 
作为 一 个 类 实例 方法 进行 定义 ， 也 不 是 列表 对 象 的 方法 。 回 忆 一 下 ,什么 时 候 调用 getattr 0 WE? 4 
在 实例 或 类 字典 中 的 完整 搜索 失败 后 ， 就 调用 它 来 查找 一 个 成 功 的 匹配 。 你 在 上 面 可 以 看 到 ， 对 
getattr O 的 调用 就 是 失败 的 那个 ， 触 发 了 异常 。 























然而 ， 我 们 还 有 一 种 “ 作 浆 ”的 方法 , 访问 实际 对 象 [通过 我 们 的 get 0 方法 ] 和 它 的 切片 能 


2» realList = wrappedList. SetO) 
2 realList[3] 
’ bar’ 
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你 现在 可 能 知道 为 什么 我 们 实现 get 0 方法 了 -一 -仅仅 是 为 了 我 们 需要 取得 对 原 对 象 进行 访 问 
这 种 情况 ， 我 们 可 以 从 访问 调用 中 直接 访问 对 象 的 属性 ， 而 忽略 局 部 变量 (realList ): 

2^» wrappedList. get 0) [3] 

"bar 























get () 方 法 返回 一 个 对 象 ， 随 后 被 索引 以 得 到 切片 片断 。 


2» f = WrapMe (open C /etc/motd' )) 
2205 f 
<wrapMe. WrapMe object at 0x40215dac^ 
2 f. get 0 
<open file '/etc/motd', mode 'r' at 0x40204ca0» 
2» f. readline () 
"Have a lot of fun... \O1Z’ 
pom dello 
21 
>> f. seek (0) 
2» print f. readline(), 
Have a lot of fun... 
2» f. close Q 
222 f. get) 
<closed file '/etc/motd', mode 'r' at 0x40204ca0» 











一 旦 你 熟悉 了 对 象 的 属性 ， 你 就 能 够 开始 理解 一 些 信 息 片 断 从 何 而 来 ， 能 够 利用 新 得 到 的 知识 
来 重复 功能 : 








2» print “<%s file fs, mode %s at %x>~ % | 

(f. closed and 'closed' or 'open', 'f.name', 
'f. mode’, id(f. get 0)) 
<closed file '/etc/motd', mode 'r' at 80e95e0» 


这 总 结 了 我 们 的 简单 包装 类 的 例子 。 我 们 还 刚 开始 接触 使 用 类 型 模拟 来 进行 类 自 定义 。 你 将 会 
发 现 你 可 以 进行 无 限 多 的 改进 , 来 进一步 增加 你 的 代码 的 用 途 。 一 种 改进 方法 是 为 对 象 添加 时 间 戳 。 
在 下 一 小 节 中 ， 我 们 将 对 我 们 的 包装 类 增加 另 一 个 维度 (dimension): 








SE fal ER DA] EL EAS 


创建 时 间 ， 修 改 时间 ， 及 访问 时 间 是 文件 的 几 个 常见 属性 ， 但 没 人 说 , 你 不 能 为 对 象 加 上 这 类 信 
息 。 毕 葛 ， 一 些 应 用 能 因 有 这 些 额 外 信息 而 受益 。 


E 
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如 果 你 对 使 用 这 三 类 时 间 顺 序 (chronological) 数据 还 不 熟 ， 我 们 将 会 对 它们 进行 解释 。 创 建 时 
E CER" ctime' ) 是 实例 化 的 时 间 ， 修 改 时 间 〔〈 或 "mtime 2 指 的 是 核心 数据 升级 的 时 间 [通常 会 调 
用 新 的 set 0 方法 ]， 而 访问 时 间 (或 atime”) 是 最 后 一 次 对 象 的 数据 值 被 获取 或 者 属性 被 访问 时 的 
TFT [8] EX 0 























更 新 我 们 前 面 定义 的 类 ， 可 以 创建 一 个 模块 twrapme. py, Ail 13. 7. 








如 何 更 新 这 些 代 码 呢 ? 好 , 首先 , 你 将 会 发 现 增加 了 三 个 新 方法 : gettimeval (), gettimestr()， 
及 set 0 。 我 们 还 增加 数 行 代码 ， 根 据 所 执行 的 访问 类 型 ， 更 新 相应 的 时 间 戳 。 


例 13.7 包装 标准 类 型 Ctwrapme. py) 








类 定义 包装 了 任何 内 建 类 型 ， 增 加 时 间 属 性 ，get O, set 0 ， 还 有 字符 串 表 示 的 方法 ， 并 授权 
所 有 保留 的 属性 ， 访 问 这 些 标准 类 型 。 

















Ig!/usr/bin/env python 





2 

3 from time import time, ctime 

4 

5 class TimedWrapMe (object): 

6 

7 def init (self, obj): 

8 self. data = obj 

9 self. ctime = self. mtime = 

10 self. atime - time() 

Il 

12 def get (self): 

13 self. atime = time (0) 

14 return self. data 

15 

16 def gettimeval(self, t type): 

17 if not isinstance(t type, str) or | 

18 t typeí0/ not in 'cma': 

19 raise TypeError, | 

20 “argument of °c’, 'm', or ’a’ req'd” 
27 return getattr(self, ' "s %stime? % | 
22 (self. class . name , t typel0])) 
23 


def gettimestr(self, t type): 
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25 return ctime (self. gettimeval (t_type)) 
26 

27 def set (self, obj): 

28 self. data = obj 

29 self. mtime = self. atime = time (0) 
30 

31 def repr (self): # repr 

32 self. atime = time (0) 

33 return ‘self. data ‘ 

34 

35 def str (self): # strQ 

36 self. atime - time() 

37 return sir(self, data) 

38 

39 def  getattr (self, attr): # delegate 
40 self. atime = time() 

4] return getattr(self. data, attr) 








gettimeval 0 方法 带 一 个 简单 的 字符 参数 ,，“c”，“m” 或 “a”， iud 对 应 于 创建 ， 修 改 或 
访问 时 间 ， 并 返回 相应 的 时 间 ， 以 一 个 浮 点 值 保 存 。gettimestr (0 仅仅 返回 一 个 经 time. ctime () 
函数 格式 化 的 打印 恨 好 的 字符 串 形 式 的 时 间 。 


为 新 的 模块 作 一 个 测试 驱动 。 我 们 已 看 到 授权 是 如 何 工 作 的 ， 所 以 ， 我 们 将 包装 没有 属性 的 对 
象 ， 来 突出 刚 加 入 的 新 的 功能 。 在 例子 中 ， 我 们 包装 了 一 个 整数 ， 然 后 ， 将 其 改 为 字符 串 。 








2» timellrappedO0bj = TimedWrapMe (932) 

2^» timeWrappedObj. gettimestr( c') 
‘Wed Apr 26 20:47:41 2006' 

2^» timeWrappedObj. gettimestr( m ) 

Wed Apr 26 20:47:41 2006' 

2^» timeWrappedObj. gettimestr( a’) 

"Wed Apr 26 20:47:41 2006' 

222 timellrappedOb 7 

932 

2^» timeWrappedObj. gettimestr( c') 

"Wed Apr 26 20:47:41 2006’ 

2^» timeWrappedObj. gettimestr (m ) 

"Wed Apr 26 20:47:41 2006’ 

2^» timeWrappedObj. gettimestr( a’) 

Wed Apr 26 20:48:05 2006' 
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你 将 注意 到 ， 一 个 对 象 在 第 一 次 被 包装 时 ， 创 建 ， 修 改 ， 及 最 后 一 次 访问 时 间 都 是 一 样 的 。 一 
旦 对 象 被 访问 ,访问 时 间 即 被 更 新 ,但 其 它 的 没有 动 。 如 果 使 用 set 0 来 置换 对 象 ， 则 修改 和 最 后 一 
次 访问 时 间 会 被 更 新 。 例 子 中 ， 最 后 是 对 对 象 的 读 访问 操作 。 








> timeWrappedObj. set time is up!') 
2^» timeWrappedObj. gettimestr (m ) 
Wed Apr 26 20:48:35 2006' 

222 timeWrappedObj 

'time is up!’ 

2^» timeWrappedObj. gettimestr( c') 
"led Apr 26 20:47:41 2006' 

2^» timeWrappedObj. gettimestr (m ) 
"Wed Apr 26 20:48:35 2006’ 

2^» timellrappedOb j. gettimestr( a’) 
Wed Apr 26 20:48:46 2006' 


改进 包装 一 个 特殊 对 象 





下 一 个 例子 ， 描 述 了 一 个 包 闭 文件 对 象 的 类 。 我 们 的 类 与 一 般 带 一 个 异常 的 文件 对 象 行为 完全 
一 样 : 在 写 模 式 中 ， 字 符 串 只 有 全 部 为 大 写 时 ， 才 写 入 文件 。 


























这 里 ， 我 们 要 解决 的 问题 是 ， 当 你 正在 写 一 个 文本 文件 ， 其 数据 将 会 被 一 台 旧 电脑 读 取 。 很 多 
老式 机 器 在 处 理 时 ， 严 格 要 求 大 写字 母 ， 所 以 ， 我 们 要 实现 一 个 文件 对 象 ， 其 中 所 有 写 入 文件 的 文 
本 会 自动 转化 为 大 写 ， 程 序 员 就 不 必 担 心 了 。 























事实 上 , 唯一 值得 注意 的 不 同 点 是 并 不 使 用 open O 内 建 函 数 , 而 是 调用 CapOpen 类 时 行 初始 化 。 
尽管 ， 参 数 同 open” 完全 一 样 。 














例 13. 8 展示 那 段 代码 ， 文 件 名 是 capOpen. py。 下 面 看 一 下 例子 中 是 如 何 使 用 这 个 类 的 : 


2» f = CapÜpen( /tmp/xxx' , °w) 

2» f.write( delegation example|n') 

2» fwrite( faye is good\n’) 

2» f.write( at delegating|n') 

2» f. close Q 

AMI 

Closed file '/tmp/xxx', mode ’w’ at 12c230» 


Pl 13. 8 包装 文件 对 象 CcapOpen. py) 
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这 个 类 扩充 了 Python FAQs 中 的 一 个 例子 ， 提 供 


文件 对 象 授 权 其 它 的 功能 。 


1 #!/usr/bin/env python 
2 
3 class CapOpen(object): 





4def | init (self, fn, mode-'r', buf--1): 


5  self.file = open(fn, mode, buf) 
6 

fdef str (self): 

8 return str(self. file) 


9 

10 def repr (self): 

ii return ‘self. file’ 

12 

13 def write(self, line): 

14 self. file. write (ine. upper 0) 


15 


16 def getattr (self, attr): 
17 return getattr (self. file, attr) 


个 文件 类 对 象 ， 定 制 write 0 方法 ， 同 时， 给 














1 


可 以 看 到 ， 唯 一 不 同 的 是 第 一 次 对 Cap0pen O 的 调用 ， 而 不 是 open 0 。 如 果 你 正 与 一 个 实际 文 
件 对 象 ， 而 非 行 为 像 文件 对 象 的 类 实例 进行 交互 ， 那 么 其 它 所 有 代码 与 你 本 该 做 的 是 一 样 的。 除了 








write(， 所 有 属性 都 已 授权 给 文件 对 象 。 为 了 下 








f E Se IER 














角 ， 我 们 加 载 文件 ， 并 显示 其 内 容 。 








QE: 可 以 使 用 open 0 或 Cap0pen() ， 这 里 因 在 本 例 中 用 到 ， 所 以 选用 Cap0pen O 。) 


2» f = CapÜpen( /tmp/xxx’, 'r') 
222 for eachLine in f: 
print eachLine, 


DELEGATION EXAMPLE FAYE IS GOOD 
AT DELEGATING 


13.16 ”新式 类 的 高 级 特性 (Python 2. 2+) 


13. 16. 1 新 式 类 的 通用 特性 











我 们 已 提 讨 论 过 有 关 新 式 类 的 一 些 特性 。 由 于 类 型 和 类 的 统一 ， 这 些 特性 中 最 重要 的 是 能 够 子 














类 化 Python 数据 类 型 。 其 中 一 个 副作用 是 ， 所 有 的 Python 内 建 的 “casting” 或 转换 函数 现在 都 
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是 工厂 函数 。 当 这 些 函 数 被 调用 时 ， 你 实际 上 是 对 相应 的 类 型 进行 实例 化 。 


-+e 








下 面 的 内 建 函 数 ， 跟 随 Python 多 日 ， 都 已 “悄悄 地 ”( 也 许 没 有 ) 转化 为 工厂 函数 : 
€ int), longQ, float(), complex () 

€ str(), unicode 0 

@ listQ, tupleQ 

€ type 

还 有 ， 加 入 了 一 些 新 的 函数 来 管理 这 些 “ 散 兵 游 勇 ”: 
basestring()' 

dict Q 

bool () 

set 0,^  frozenset(* 

object () 

classmethod () 

staticmethod () 

super () 

property () 

file) 

















为 基 类 ， 去 子 类 化 类 型 ， 现 在 还 可 以 用 于 isinstance () 内 建 函 数 。 使 用 isinstance () fleas HF 
换 用 烦 了 的 旧 风 格 ， 而 使 用 只 需 少量 函数 调用 就 可 以 得 到 清晰 代码 的 新 风格 。 比 如 ， 为 测试 一 个 对 
象 是 否 是 一 个 整数 ， 旧 风格 中 ， 我 们 必须 调用 type () 两 次 或 者 import 相关 的 模块 并 使 用 其 属性 ; 但 
现在 只 需要 使 用 isinstance() ， 甚 至 在 性 能 上 也 有 所 超越 : 








这 些 类 名 及 工厂 函数 使 用 起 来 ， 很 灵活 。 不 仪 能 够 创建 这 些 类 型 的 新 对 象 ， 它 们 还 可 以 用 来 作 














OLD (not as good): 
€ if type(obj) == type(0)… 
€ if type(obj) == types. IntType:-: 


BETTER: 
€ if type(obj) is type(0)… 


EVEN BETTER: 
€ if isinstance(obj, int): 
€ if isinstance(obj, (int, long)):- 
© if type(obj) is int: 





W: 尽管 isinstance(O 很 灵活 ， 但 它 没 有 执行 “严格 匹配 ”比较 -一 -如 果 obj 是 一 个 给 定 类 
型 的 实例 或 其 子 类 的 实例 ， 也 会 返回 True。 但 如 果 想 进行 严格 匹配 ， 你 仍然 需要 使 用 is 操作 符 。 
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Python 2.3 中 新 增 。 
Python 2. 4 中 新 增 。 





TE Ok 


请 复习 13.12. 2 TUR X isinstanceO 的 深入 解释 ， 还 有 在 第 4 章 中 介绍 这 些 调用 是 如 何 随同 
Python 的 变化 而 变化 的 。 





13.16.2 slots 类 属性 





—— 








字典 位 于 实例 的 “心脏 ” dict 属性 跟踪 所 有 实例 属性 。 举 例 来 说 ， 你 有 一 个 实例 inst. € 
有 一 个 属性 foo, AEA inst. foo 来 访问 它 与 使 用 inst. dict __[ foo ] 来 访问 是 一 致 的 。 

















字典 会 占据 大 量 内 存 ， 如 果 你 有 一 个 属性 数量 很 少 的 类 , 但 有 很 多 实例 ,那么 正好 是 这 种 情况 。 
为 内 存 上 的 考虑 ， 用 户 现 在 可 以 使 用 _slots 属性 来 替代 dict . 














SEAL, slots 是 一 个 类 变量 ， 由 一 序列 型 对 象 组 成 ， 由 所 有 合法 标识 构成 的 实例 属性 的 集 
合 来 表示 。 它 可 以 是 一 个 列表 ， 元 组 或 可 迭代 对 象 。 也 可 以 是 标识 实例 能 拥有 的 唯一 的 属性 的 简单 
字符 串 。 任 何 试图 创建 一 个 其 名 不 在 _slots_ 中 的 名 字 的 实例 属性 都 将 导致 AttributeError 异常 : 


class SlottedClass (object): 
__ slots_ = (C foo’, 'bar 
2295 c = SlottedClass 0 


225 

222 c. foo = 42 

25» c. xxx = “don’t think so” Traceback (most recent call last): 
File “stdin, line l, in ? 

AttributeError: 'SlottedClass' object has no attribute 


3 J 
XXX 





























这 种 特性 的 主要 目的 是 节约 内 存 。 其 副作用 是 某 种 类 型 的 安全“ 它 能 防止 用 户 随心 所 欲 的 动态 
增加 实例 属性 。 带 _slots_ 属 性 的 类 定义 不 会 存在 _dict 了 〔 除 非 你 在 _slots_ 中 增加 
' dict “元 素 )。 更 多 有 关 _slots_ 的 信息 ， 请 参见 Python 语言) 参考 手册 中 有 关 数 据 模型 章 
d. 




















13.16.3 ”特殊 方法 getattribute 0 








Python 类 有 一 个 名 为 ”getattr O 的 特殊 方法 ， 它 仅 当 属性 不 能 在 实例 的 _dict ”或 它 的 类 
(类 的 _dict O, 或 者 祖先 类 (其 diet ) 中 找到 时 ， 才 被 调用 。 我 们 曾 在 实现 授权 中 看 到 过 使 
用 getattr O. 


E 
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很 多 用 户 碰 到 的 问题 是 ， 他 们 想 要 一 个 适当 的 函数 来 执行 每 一 个 属性 访问 ， 不 光 是 当 属性 不 能 
找到 的 情况 。 这 就 是 _getattribute 用 武之 处 了 。 它 使 用 起 来 ， 类 似 _getattr QO， 不 同 之 处 
在 于 ， 当 属性 被 访问 时 ， 它 就 一 直 都 可 以 被 调用 ， 而 不 局 限于 不 能 找到 的 情况 。 






































如 果 类 同时 定义 了 getattribute OX getattr 0 〇 方法, 除非 明确 从 get-attribute 0 
调用 , 或 getattribute 0 引发 了 AttributeError 异常 , 否则 后 者 不 会 被 调用 . 











如 果 你 将 要 在 此 ( 译 者 注 :”getattribute 0 中 ) 访 问 这 个 类 或 其 祖先 类 的 属性 ， 请 务必 小 心 。 
如 果 你 在 ”getattribute 0 中 不 知 何故 再 次 调用 了 getattribute _() ， 你 将 会 进入 无 穷 递归 。 
为 避免 在 使 用 此 方法 时 引起 无 穷 递 轨 ， 为 了 安全 地 访问 任何 它 所 需要 的 属性 , 你 总 是 应 该 调用 祖先 类 
的 同名 方法 ; 比如 ，super (obj, self). getattribute (attr)。 此 特殊 方法 只 在 新 式 类 中 有 效 。 
[] slots 一 样 ， 你 可 以 参考 Python (GE EO 参考 手册 中 数据 模型 章节 ， 以 得 到 更 多 有 关 
”getattribute (的 信息 。 


























13.16.4 描述 符 




















描述 符 是 Python 新 式 类 中 的 关键 点 之 一 。 它 为 对 象 属性 提供 强大 的 API。 你 可 以 认为 描述 符 是 
表示 对 象 属性 的 一 个 代理 。 当 需要 属性 时 ， 可 根据 你 遇 到 的 情况 ， 通 过 描述 符 〈 如 果 有 ) 或 者 采用 
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常规 方式 〈 句 点 属性 标识 法 ) 来 访问 它 。 





如 你 的 对 象 有 代理 ， 并 且 这 个 代理 有 一 个 “get” 属 性 (实际 写法 为 get。) ， 当 这 个 代理 被 调 
用 时 ， 你 就 可 以 访问 这 个 对 象 了 。 当 你 试图 使 用 描述 符 (set) 给 一 个 对 象 赋值 或 删除 一 个 属性 
(delete) 时 ， 这 同样 适用 。 


























—= 


get O, set O, delete (特殊 方法 





严格 来 说 ， 描 述 符 实际 上 可 以 是 任何 (新式) 类 ， 这 种 类 至 少 实现 了 三 个 特殊 方法 
get O0, set OR delete 0 中 的 一 个 ， 这 三 个 特殊 方法 充当 描述 符 协 议 的 作用 。 刚 才 提 到 














X, get 0 可 用 于 得 到 一 个 属性 的 值 ， set 0 是 为 一 个 属性 进行 赋值 的 ， 在 采用 del 语句 (或 
其 它 ， 其 引用 计数 递减 ) 明确 删除 掉 某 个 属性 时 会 调 _delete 0 方法 。 三 者 中 ,后 者 很 少 被 实现 。 












































还 有 , 也 不 是 所 有 的 描述 符 都 实现 了 _ set OTE. 它们 被 当 作 方 法 描述 符 , 或 更 准确 来 说 是 ， 
非 数 据 描述 符 来 被 引用 。 那 些 同时 覆盖 ”get OR set 0 的 类 被 称 作 数据 描述 符 ， 它 比 非 数据 
描述 符 要 强大 些 。 
The signatures for | get (, set (0, and delete () look like this: 
get 0, set OX delete _ OIRE, WF: 
€ def get (self, obj, typ-None) ==> value 
@ def set (self, obj, val) ==> None 
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© def delete (self, obj) ==> None 














如 果 你 想 要 为 一 个 属性 写 个 代理 ， 必 须 把 它 作为 一 个 类 的 属性 ， 让 这 个 代理 来 为 我 们 做 所 有 的 


工作 。 当 你 用 这 个 代理 来 处 理 对 一 个 属性 的 操作 时 ， 你 会 得 到 一 个 描述 符 来 代理 所 有 的 函数 功能 。 
































我 们 在 前 面 的 一 节 中 己 经 讲 过 封装 的 概念 。 这 里 我 们 会 进一步 来 探讨 封装 的 问题 。 现 在 让 我 们 来 处 
理 更 加 复杂 的 属性 访问 问题 ， 而 不 是 将 所 有 任务 都 交 给 你 所 写 的 类 中 的 对 象 们 。 


























. getattribute O0 特殊 方法 (二 ) 






































使 用 描述 符 的 顺序 很 重要 ， 有 一 些 描述 符 的 级 别 要 高 于 其 它 的 。 整 个 描述 符 系 统 的 心脏 是 
. getattribute QO， 因为 对 每 个 属性 的 实例 都 会 调用 到 这 个 特殊 的 方法 。 这 个 方法 被 用 来 查找 类 
的 属性 ， 同 时 也 是 你 的 一 个 代理 ， 调 用 它 可 以 进行 属性 的 访问 等 操作 。 





























回顾 一 下 上 面 的 原型 ， 如 果 一 个 实例 调用 了 get 0 方法， 这 就 可 能 传 入 了 一 个 类 型 或 类 的 对 
象 。 举 例 来 说 ， 给 定 类 X 和 实例 x，x. foo 由 getattribute 0 转化 成 : 


type(x). dict [foo’]. get (x, type(x)) 





如 果 类 调用 了 get 0 方法 ， 那 么 None 将 作为 对 象 被 传 入 (对 于 实例 ， 传 入 的 是 self) : 


: X dict ['foo']. get (None, X) : 


Ba, WR superOWHWHT, thon, Aw Y WX 的 子 类 ， 然 后 用 super (Y, obj). foo 在 
obj. class . mro 中 紧 接 类 Y 治 着 继承 树 来 查找 类 X， 然 后 调用 : 








X dict [('foo']. get (obj, X) 
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优先 级 别 





由 于 _getattribute__(0 的 实现 方式 很 特别 ， 我 们 在 此 对 _getattribute__() 方 法 的 执行 方式 
做 一 个 介绍 。 因 此 了 解 以 下 优先 级 别 的 排序 就 非常 重要 了 : 








数据 描述 符 

实例 属性 

非 数据 描述 符 
默认 为 getattr 0 
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描述 符 是 一 个 类 属性 ， 因 此 所 有 的 类 属性 名 具有 最 高 的 优先 级 。 你 其 实 可 以 通过 把 一 个 描述 符 
的 引用 赋 给 其 它 对 象 来 蔡 换 这 个 描述 符 。 比 它们 优先 级 别 低 一 等 的 是 实现 了 _get 0 和 _set 0 
方法 的 描述 符 。 如 果 你 实现 了 这 个 描述 符 ， 它 会 像 一 个 代理 那样 帮助 你 完成 所 有 的 工作 ! 



























































否则 ， 它 就 默认 为 局 部 对 象 的 _dict_ 的 值 ， 也 就 是 说 ， 它 可 以 是 一 个 实例 属性 。 接 下 来 是 非 
数据 描述 符 。 可 能 第 一 次 听 起 来 会 吃惊 ， 有 人 可 能 认为 在 这 条 “食物 链 ” 上 非 数 据 描述 符 应 该 比 实 
例 属性 的 优先 级 更 高 ， 但 事实 并 非 如 此 。 非 数据 描述 符 的 目的 只 是 当 实 例 属 性 值 不 存在 时 ， 提 供 一 
个 值 而 已 。 这 与 以 下 情况 类 似 : 当 在 一 个 实例 的 _dict 中 找 不 到 某 个 属性 时 ， 才 去 调用 
getattr ()。 



































关于 getattr 0 的 说 明 ， 如 果 没 有 找到 非 数 据 描述 符 ， 那 么 ”getattribute 0 〇 将 会 抛 出 一 
^* AttributeError 异常 , 接着 会 调用 getattr 0 做 为 最 后 一 步 操 作 , 否则 AttributeError 会 ik 
回 给 用 户 。 








描述 符 举 例 


让 我 们 来 看 一 个 简单 的 例子 ... 用 一 个 描述 符 禁 止 对 属性 进行 访问 或 赋值 的 请 求 。 事 实 上 ， 以 下 
所 有 示例 都 忽略 了 全 部 请 求 ， 但 它们 的 功能 逐步 增多 ， 我 们 希望 你 通过 每 个 示例 逐步 掌握 描述 符 的 
使 用 : 








class DevNulll (object): 

def get (self, obj, typ=None): 
pass 
def set (self, obj, val): 


pass 





我 们 建立 一 个 类 ， 这 个 类 使 用 了 这 个 描述 符 ， 给 它 赋 值 并 显示 其 值 : 





22^ class Cl (object): 
foo = DevNulll Q 


2 cl = C10 
225 el foo = ‘bar’ 
22^ print 'cl.foo contains:', cl. foo 


cl.foo contains: None 


That was not too terribly exciting … how about one where the descriptor methods at 


least give some output to show what is going on? 


这 并 没有 什么 有 趣 的 ..， 让 我 们 来 看 看 在 这 个 描述 符 中 写 一 些 输出 语句 会 怎么 样 ? 











$— 一 * 一 
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class DevNull2 (object): 
def get (self, obj, typ=None): 
print 'Accessing attribute... ignoring. 
def set (self, obj, val): 
print “Attempt to assign %r... ignoring’ % (val) 








现在 我 们 来 看 看 修改 后 的 结果 : 


22^ class C2(object): 
foo = DevNul12() 


M c2 = C20 


2225 c2. foo = ‘bar’ 

Attempt to assign "bar ... ignoring 
222 x = c2. foo 

Accessing attribute... ignoring 


2» print ’c2. foo contains:’, x 
c2. foo contains: None 








最 后 ， 我 们 在 描述 符 所 在 的 类 中 添加 一 个 占 位 符 ， 占 位 符 包 含有 关于 这 个 描述 符 的 有 用 信息 : 














class DevNull3 (object): 
def init (self, name=None): 
self. name = name 
def get (self, obj, typ=None): 
print 'Accessing [%s/... ignoring! % 
self. name) 
def set (self, obj, val): 
print “Assigning %r to [%s/... ignoring! % 
val, self. name) 








下 面 的 输出 结果 表明 我 们 前 面 提 到 的 优先 级 层次 结构 的 重要 性 ， 尤 其 是 我 们 说 过 ， 一 个 完整 的 
数据 描述 符 比 实例 的 属性 具有 更 高 的 优先 级 : 


























22^ class C3(object): 
foo = DevNull3( foo’) 


M» c3 = C30 
2» c3. foo = Bar 
Assigning "bar! to [foo]... ignoring 
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225 x = cÓ. foo 


Accessing [foo]... ignoring 





ASS print ‘ed. foo contains: , x 

c3. foo contains: None 

2» print 'Let us try to sneak it into c3 instance... 
Let us try to sneak it into c3 instance... 

2» c3 dict [('foo'] = *bar’ 

222 x = c3. foo 

Accessing [foo]... ignoring 

22» print 'cÀ.foo contains:’, x 

c3. foo contains: None 

2 print c3.. dict d('foo | contains: Sr" % | 
eA diet [’ foo L. “.. whyP!?" 

cJ. dict ['foo'] contains: 'bar' ... why?!? 








请 注意 我 们 是 如 何 给 实例 的 属性 赋值 的 。 给 实例 属性 c3. foo 赋值 为 一 个 字符 串 “bar”。 但 由 于 
数据 描述 符 比 实例 属性 的 优先 级 高 ， 所 赋 的 值 “bar” 被 隐藏 或 覆盖 了 。 












































同样 地 ， 由 于 实例 属性 比 非 数据 描述 符 的 优先 级 高 ， 你 也 可 以 将 非 数据 描述 符 隐 藏 。 这 就 和 你 
给 一 个 实例 属性 赋值 ， 将 对 应 类 的 同名 属性 隐藏 起 来 是 同一 个 道理 ， 











22^ class FooFoo (object): 
def foo(self): 
print 'Very important foo() method.’ 
225 
2» bar = FooFoo() 


22» bar. foo () 
Very important foo() method. 


225 

22^ bar. foo = It is no longer here.’ 
222 bar. foo 

'It is no longer here.’ 

225 


222 del bar. foo 
222 bar. foo () 
Very important foo() method. 





这 是 一 个 直 日 的 示例 。 我 们 将 foo 做 为 一 个 函数 调用 ， 然 后 又 将 它 作 为 一 个 字符 串 访问 ， 但 我 
们 也 可 以 使 用 另 一 个 函数 ， 而 且 保 持 相同 的 调用 机 制 
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2> def barBar(): 
print 'foo() hidden by barBar()’ 





222 bar. foo = barBar 

222 bar. foo () 

foo() hidden by barBar () 
225 

222 del bar. foo 

22» bar. foo () 

Very important foo() method. 











要 强调 的 是 : KA EAR KAREA EDAR, BRAT AY VA i ET AERIS d 
述 符 ， 只 需 简 单 的 把 一 个 对 象 赋 给 实例 (使 用 相同 的 名 字 )〉 就 可 以 了 。 

















我 们 最 后 这 个 示例 完成 的 功能 更 多 一 些 ， 它 尝试 用 文件 系统 保存 一 个 属性 的 内 容 ， 这 是 个 雏形 
版 本 。 





第 1-10 行 
在 引入 相关 模块 后 ， 我 们 编写 一 个 描述 符 类 ， 类 中 有 一 个 类 属性 (saved)， 它 用 来 记录 描述 符 
访问 的 所 有 属性 。 描 述 符 创 建 后 ， 它 将 注册 并 且 记 录 所 有 从 用 户 处 接收 的 属性 名 。 

















—= 
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在 获取 描述 符 的 属性 之 前 ， 我 们 必须 确保 用 户 给 它们 赋值 后 才能 使 用 。 如 果 上 述 条 件 成 立 ， 接 
着 我 们 将 尝试 打开 pickle 文件 以 读 取 其 中 所 保存 的 值 。 如 果 文 件 打开 失败 ， 将 引发 一 个 异常 。 文 件 
打开 失败 的 原因 可 能 有 以 下 几 种 : 文件 已 被 删除 了 (或 从 未 创建 过 ) ， 或 是 文件 已 损坏 ， 或 是 由 于 某 
种 原因 ， 不 能 被 pickle 模块 反串 行 化 。 















































第 18-38 íT 

将 属性 保存 到 文件 中 需要 经 过 以 下 几 个 步 双 : 打开 用 于 写 入 的 pickle 文件 (可 能 是 首次 创建 一 
个 新 的 文件 ， 也 可 能 是 删 掉 旧 的 文件 )， 将 对 象 串 行 化 到 磁盘 ， 注 册 属 性 名 ， 使 用 户 可 以 读 取 这 些 属 
性 值 。 如 果 对 象 不 能 被 bickle{ 待 统一 命名 } ， 将 引发 一 个 异常 。 注 意 ， 如 果 你 使 用 的 是 Python2. 5 
以 前 的 版 本 ， 你 就 不 能 合并 try-except 和 try-finally 语句 (第 30-38 17) 。 























例 13.9 使 用 文件 来 存储 属性 (descr. py) 





这 个 类 是 一 个 雏形 ， 但 它 展 示 了 描述 符 的 一 个 有 趣 的 应 用 一 一 可 以 在 一 个 文件 系统 上 保存 属 ! 
的 内 容 。 
Ig!/usr/bin/env python 


HE 























Edit By Vheavens 


Edit By Vheavens 


ee 
T | 


3 import os 





4 import pickle 

5 

6class FileDescr (object) : 
7 saved = /J 


8 
9 def init (self, name=None): 
10 self. name = name 
Il 
72 def get (self, obj, typ=None): 
13 If self.name not in FileDescr. saved: 
14 raise AttributeError, | 
15 “Yr used before assignment’ % self. name 
16 
17 try: 
18 f = open(self. name, 'r') 
19 val = pickle. load(f) 
20 f. close Q 
21 return val 
22 except (pickle. InpicklingError, IOError, 
23 LOFError, AttributeError, 
24 ImportError, IndexError), e: 
25 raise AttributeError, | 
26 “could not read %r: fís^ % self. name 
27 
28 def set (self, obj, val): 
29 f = open (self. name, °w) 
30 try: 
31 try: 
32 pickle. dump (val, £) 
33 FileDescr. saved. append (self. name) 
34 except (TypeError, pickle. PicklingError), e: 
35 raise AttributeError, | 
36 “could not pickle Yr” % self. name 
oF finally: 
38 f. close Q 
39 
40 def delete (self, obj): 
41 try: 
42 os. unlink (self. name) 
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43 FileDescr. saved. remove (self. name) 
44 except (OSError, ValueError), e: 

45 pass 

第 40-45 fT 








最 后 ， 如 果 属 性 被 删除 了 ， 文 件 会 被 删除 ， 属 性 名 字 也 会 被 注销 。 以 下 是 这 个 类 的 用 法 示例 : 
» class MyFileVarClass (object): 
ido = FileDescr( foo’) 
p» = FileDescr( bar’) 


22^ fve = MyFileVarClass () 
222 print fve. foo 
Traceback (most recent call last): File “<stdin>”, line 1, in ? 
File “descr. py”, line 14, in get . 
raise AttributeError, | 
AttributeError: 'foo! used before assignment 
P» 
222 fvc.foo = 42 
222 fvc. bar = 'leanna' 
P», 
222 print fve. foo, fve. bar 
42 leanna 
225 
222 del fve. foo 
222 print fve. foo, fve. bar 
Traceback (most recent call last): File “<stdin>*, line 1, in ? 
File “descr. py”, line 14, in get . 
raise AttributeError, | 
AttributeError: 'foo! used before assignment 
225 
25» fve. foo = builtins | Traceback (most recent call last): 
File “stdin, line l, in ? 
File “descr. py”, line 35, in set - 
raise AttributeError, | AttributeError: could not pickle ’ foo’ 

















属性 访问 没有 什么 特别 的 ， 程 序 员 并 不 能 准确 判断 一 个 对 象 是 否 能 被 打包 后 存储 到 文件 系统 中 
(除非 如 最 后 示例 所 示 ， 将 模块 pickle， 我 们 不 该 这 样 做 ) 。 我 们 也 编写 了 异常 处 理 的 语句 来 处 理 文 
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件 损坏 的 情况 。 在 本 例 中 ， 我 们 第 一 次 在 描述 符 中 实现 _delete 0 方法 。 














请 注意 ， 在 示例 中 ， 我 们 并 没有 用 到 obj 的 实例 。 别 把 obj 和 self fii. iX self 是 指 描 
述 符 的 实例 ， 而 不 是 类 的 实例 。 











描述 符 总 ^ a 








你 已 经 看 到 描述 符 是 怎么 工作 的 。 静 态 方法 、 类 方法 、 属 性 ( 见 下 面 一 节 ) ， 甚 至 所 有 的 函数 都 
是 描述 符 。 想 一 想 : 函数 是 Python 中 常见 的 对 象 。 有 内 置 的 函数 、 用 户 自 定义 的 函数 、 类 中 定义 的 
方法 、 静 态 方法 、 类 方法 。 这 些 都 是 函数 的 例子 。 它们 之 间 唯 一 的 区 别 在 于 调用 方式 的 不 同 。 通常 ， 
函数 是 非 绑 定 的 。 虽 然 静 态 方法 是 在 类 中 被 定义 的 ， 它 也 是 非 绑 定 的 。 但 方法 必须 绑 定 到 一 个 实例 
上 ， 类 方法 必须 绑 定 到 一 个 类 上 ， 对 不 ? 一 个 函数 对 象 的 描述 符 可 以 处 理 这 些 问题 ， 描 述 符 会 根据 
函数 的 类 型 确定 如 何 “封装 ”这 个 函数 和 函数 被 绑 定 的 对 象 ， 然 后 返回 调用 对 象 。 它 的 工作 方式 是 
这 样 的 ， 函数 本 身 就 是 一 个 描述 符 ， 函 数 的 _get 0 方法 用 来 处 理 调用 对 象 ， 并 将 调用 对 象 返 回 给 
你 。 描 述 符 具 有 非常 棒 的 适用 性 ， 因 此 从 来 不 会 对 Python 自己 的 工作 方式 产生 影响 。 























































































































属性 和 property O 内 建 函 数 














属性 是 一 种 有 用 的 特殊 类 型 的 描述 符 。 它 们 是 用 来 处 理 所 有 对 实例 属性 的 访问 ， 其 工作 方式 和 
我 们 前 面 说 过 的 描述 符 相 似 。“ 一 般 ” 情 况 下 ， 当 你 使 用 点 属性 符号 来 处 理 一 个 实例 属性 时 ， 其 实 . 






































你 是 在 修改 这 个 实例 的 _dict_ 属 性。 


— 











表面 上 来 看 ， 你 使 用 propertyO 访 问 和 一 般 的 属性 访问 方法 没有 什么 不 同 ， 但 实际 上 这 种 访问 
的 实现 是 不 同 的 - 它 使 用 了 函数 (或 方法 )。 在 本 章 的 前 面 ， 你 已 看 到 在 Python 的 早期 版 本 中 ， 我 
们 一 般 用 _getattr O 和 setattr Q 来 处 理 和 属性 相关 的 问题 。 属 性 的 访问 会 涉及 到 以 上 特 
殊 的 方法 (和 _ getattribute _O)， 但 是 如 果 我 们 用 property () 来 处 理 这 些 问题 ， 你 就 可 以 写 一 个 
和 属性 有 关 的 函数 来 处 理 实例 属性 的 获取 (getting), WME (setting), MAER (deleting) 操作 ， 而 不 
必 再 使 用 那些 特殊 的 方法 了 (如 果 你 要 处 理 大 量 的 实例 属性 ， 使 用 那些 特殊 的 方法 将 使 代码 变 得 很 腔 
肿 )。 










































































property O 内 建 函 数 有 四 个 参数 ， 它 们 是 : 





property (fget=None, fset=None, fdel=None, doc=None) 





请 注意 property O 的 一 般 用 法 是 ， 将 它 写 在 一 个 类 定义 中 ，property O 接受 一 些 传 进来 的 函数 
(其 实 是 方法 ) 作为 参数 。 实 际 上 ，property O 是 在 它 所 在 的 类 被 创建 时 被 调用 的 ， 这 些 传 进 来 的 ( 作 
为 参数 的 ) 方 法 是 非 绑 定 的 ， 所 以 这 些 方法 其 实 就 是 函数 ! 





























下 面 的 一 个 例子 : 在 类 中 建立 一 个 只 读 的 整数 属性 ， 用 逐 位 异 或 操作 符 将 它 隐藏 起 来 : 
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class ProtectAndHideX (object): 
def init (self, x): 
assert isinstance(x, int), | 


IW 4 


x^ must be an integer!’ 





gelfo gc 


def get x(self): 
return self. x 


x = property (get x) 
我 们 来 运行 这 个 例子 , 会 发 现 它 只 保存 我 们 第 一 次 给 出 的 值 , 而 不 允许 我 们 对 它 做 第 二 次 修改 : 


2 inst = ProtectAndHideX( foo’) 
Traceback (most recent call last): 
File “<stdim*, line l, in ? 
File “prop. py”, line 5, in init . 
assert isinstance(x, int), | 
AssertionError: ^x^ must be an integer! 
2 inst = ProtectAndHideX (10) 
2 print inst. x =, inst. x 
inst.x = 10 
222 Inst. x = 20 
Traceback (most recent call last): 
File "Xstdin^', line l, in ? 


AttributeError: can't set attribute 
下 面 是 另 一 个 关于 setter 的 例子 : 


class HideX (object): 
def init (self, x): 
self.x = x 


def get x(self): 
return self. x 


def set x(self, x): 


assert isinstance(x, int), | 


IY 4 


x^ must be an integer!’ 


self. x= x 
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x - property(get x, set x) 





本 示例 的 输出 结果 : 


2^» inst = HideX (20) 
222 print inst. x 

20 

222 Inst. x = 30 

222 print inst. x 

30 





属性 成 功 保存 到 x 中 并 显示 出 来 ， 是 因为 在 调用 构造 器 给 x 赋 初 始 值 前 ， 在 getter 中 已 经 将 x 
IRJ self. x. 





你 还 可 以 给 自己 写 的 属性 添加 一 个 文档 字符 串 ， 参 见 下 面 这 个 例子 : 





from math import pi 


def get pi (dummy): 


return pi 


class PI (object): 
pi = property (get pi, doc-' Constant “pi~’) 











为 了 说 明 这 是 可 行 的 实现 方法 ， 我 们 在 property 中 使 用 的 是 一 个 函数 而 不 是 方法 。 注 意 在 调用 
函数 时 self 作为 第 一 个 (也 是 唯一 的 ) 参数 被 传 入 ， 所 以 我 们 必须 加 一 个 伪 变 量 把 self 丢弃 。 下 面 
是 本 例 的 输出 : 





2 inst = PIO 

222 inst. pi 

3. 1415926535897931 

222 print PI. pi. doc . 


ad 


Constant “pi” 





你 明白 properties 是 如 何 把 你 写 的 函数 (fget，fset 和 fdel) 影 射 为 描述 符 的 _get O, 
. set Q, fM delete 0 〇 方法 的 吗 ? 你 不 必 写 一 个 描述 符 类 ， 并 在 其 中 定义 你 要 调用 的 这 些 方法 。 
只 要 把 你 写 的 函数 (或 方法 ) 全 部 传递 给 property 0 〇 就 可 以 了 。 



































在 你 写 的 类 定义 中 创建 描述 符 方法 的 一 个 浆 端 是 它 会 搞 乱 类 的 名 字 空 间 。 不 仅 如 此 ， 这 种 做 法 








$— 一 * 一 
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也 不 会 像 broperty O 那样 很 好 地 控制 属性 访问 。 如 果 不 用 property 0 这 种 控制 属性 访问 的 目的 就 不 
可 能 实现 。 我 们 的 第 二 个 例子 没有 强制 使 用 property 0) ， 因 为 它 允 许 对 属性 方法 的 访问 (由 于 在 类 定 
义 中 包含 属性 方法 ) : 


























25» inst.set x(40) # can we require inst. x = 40? 
222 print inst. x 
40 


APNPC (ActiveState Programmer Network Python Cookbook) 
(http://aspn. activestate. com/ASPN/Cookbook/Python/Recipe/205183) 上 的 一 条 精明 的 办 
法 解决 了 以 下 问题 : 


@ “借用 ”一 个 函数 的 名 字 空 间 
e 编写 一 个 用 作 内 部 函数 的 方法 作为 property (的 (关键 字 ) 参数 

e (H locals 0 ) 返 回 一 个 包含 所 有 的 (函数 /方法 ) 名 和 对 应 对 象 的 字典 
e 

e 








把 字典 传 入 property 0, 28 
去 掉 临 时 的 名 字 空 间 




















这 样 ， 方 法 就 不 会 再 把 类 的 名 字 空 间 搞 乱 了 ， 因 为 定义 在 内 部 函数 中 的 这 些 方法 属于 其 它 的 
名 字 空 间 。 由 于 这 些 方法 所 属 的 名 字 空 间 已 超出 作用 范围 ， 用 户 是 不 能 够 访问 这 些 方法 的 ， 所 以 通 
过 使 用 属性 property 0 来 访问 属性 就 成 为 了 唯一 可 行 的 办 法 。 根据 APNPC 上 方法 ,我 们 来 修改 这 个 


AE 
































class HideX (object): 
def init (self, x): 
self.x =x 


@roperty 
def x0: 
def fget (self): 
return self. x 


def fset(self, x): 
assert isinstance(x, int), | 


x^ must be an integer!’ 
self, x= “x 


return locals 0 





我 们 的 代码 工作 如 初 ， 但 有 两 点 明显 不 同 : (D 类 的 名 字 空 间 更 加 简洁 ， 只 有 U doc ', 
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init ', ' module ', °x ]，(2)， 用 户 不 能 再 通过 inst. set x(40) 给 属性 赋值 ... 必须 
使 用 init. x = 40. 我 们 还 使 用 函数 修饰 符 (@property) 将 函数 中 的 x 赋值 到 一 个 属性 对 象 。 由 于 
修饰 符 是 从 Python 2.4 版 本 开始 引入 的 ， 如 果 你 使 用 的 是 Python 的 早期 版 本 2.2. x 或 2.3.x， 请 
将 修饰 符 @property E, Æ x0 的 函数 声明 后 添加 x = property Ge*x () ) 。 














13.16.5 Metaclasses 和 metaclass . 


元 类 (Metaclasses) 是 什么 ? 


元 类 可 能 是 添加 到 新 风格 类 中 最 难以 理解 的 功能 了 。 元 类 让 你 来 定义 某 些 类 是 如 何 被 创建 的 ， 
从 根本 上 说 ， 赋 予 你 如 何 创 建 类 的 控制 权 。 (你 甚至 不 用 去 想 类 实例 层面 的 东西 。) 早 在 Pythonl. 5 
的 时 代 ， 人 们 就 在 谈论 这 些 功能 (当时 很 多 人 都 认为 不 可 能 实现 ) ， 但 现在 终于 实现 了 。 

















从 根本 上 说 ， 你 可 以 把 元 类 想 成 是 一 个 类 中 类 ， 或 是 一 个 类 ， 它 的 实例 是 其 它 的 类 。 实 际 上 ， 
当 你 创建 一 个 新 类 时 ， 你 就 是 在 使 用 默认 的 元 类 ， 它 是 一 个 类 型 对 象 。 (对 传统 的 类 来 说 ， 它 们 的 元 
类 是 types. ClassType. ) 当 茶 个 类 调用 type O 函数 时 ， 你 就 会 看 到 它 到 底 是 谁 的 实例 : 








class C(object): 


pass 
class CC: 
pass 


25» type (C) 

«type 'type'^ 

Po» 

22^ type (CC) 

«type 'classobj' ^ 

225 

222 import types 

22^ type(CC) is types. ClassType 
True 


什么 时 候 使 用 元 类 ? 














元 类 一 般 用 于 创建 类 。 在 执行 类 定义 时 ， 解 释 器 必须 要 知道 这 个 类 的 正确 的 元 类 。 解 释 器 会 先 
寻找 类 属性 ”metaclass”， 如 果 此 属性 存在 ， 就 将 这 个 属性 赋值 给 此 类 作为 它 的 元 类 。 如 果 此 属性 
没有 定义 ， 它 会 向 上 查找 父 类 中 的 _metaclass”. 所 有 新 风格 的 类 如 果 没 有 任何 父 类 ， 会 从 对 象 或 
类 型 中 继承 。(type (object) 当然 是 类 型 ). 
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如 果 还 没有 发 现 _metaclass_ 属性， 解释 器 会 检查 名 字 为 ”metaclass。_ 的 全 局 变量 ， 如 果 它 
存在 ,就 使 用 它 作 为 元 类 。 否 则 ， 这 个 类 就 是 一 个 传统 类 ， 并 用 types. ClassType 作为 此 类 的 元 类 。 
(注意 : 在 这 里 你 可 以 运用 一 些 技巧 .. .如果 你 定义 了 一 个 传统 类 ， 并 且 设 置 它 的 _metaclass = 
type， 其 实 你 是 在 将 它 升级 为 一 个 新 风格 的 类 !) 




















在 执行 类 定义 的 时 候 ， 将 检查 此 类 正确 的 (一 般 是 默认 的 ) 元 类 ， 元 类 (通常 ) 传递 三 个 参数 (到 构 
造 器 ) :类 名 ， 从 基 类 继承 数据 的 元 组 ， 和 (类 的 ) 属性 字典 。 








谁 在 用 元 类 ? 


元 类 这 样 的 话题 对 大 多 数 人 来 说 属于 理论 化 或 纯 面 向 对 象 思 想 的 范畴 ， 认 为 它 在 实际 编程 中 没 
有 什么 实际 意义 。 从 某 种 意义 上 讲 这 种 想法 是 正确 的 ; 但 最 重要 的 请 铭记 在 心 的 是 ， 元 类 的 最 终 使 
用 者 不 是 用 户 ， 正 是 程序 员 自 己 。 你 通过 定义 一 个 元 类 来 “迫使 ”程序 员 按 照 某 种 方式 实现 目标 类 ， 
这 将 既 可 以 简化 他 们 的 工作 ， 也 可 以 使 所 编写 的 程序 更 符合 特定 标准 。 



































元 类 何 时 被 创建 ? 





前 面 我 们 已 提 到 创建 的 元 类 用 于 改变 类 的 默认 行为 和 创建 方式 。 大 多 数 Python 用 户 都 无 须 创 
建 或 明确 地 使 用 元 类 。 创 建 一 个 新 风格 的 类 或 传统 类 的 通用 做 法 是 使 用 系统 自己 所 提供 的 元 类 的 默 
认 方 式 。 
































用 户 一 般 都 不 会 觉察 到 元 类 所 提供 的 创建 类 (或 元 类 实例 化 ) 的 默认 模板 方式 。 虽 然 一 般 我 们 并 
不 创建 元 类 , 还 是 让 我 们 来 看 下 面 一 个 简单 的 例子 。 (关于 更 多 这 方面 的 示例 请 参见 本 节 末尾 的 文档 
列表 。) 








元 类 示例 1 





我 们 第 一 个 关于 元 类 的 示例 非常 简单 (希望 如 此 ) 。 它 只 是 在 用 元 类 创建 一 个 类 时 ， 显 示 时 间 标 
。《 你 现在 该 知道 ， 这 发 生 在 类 被 创建 的 时 候 。) 


m 








看 下 面 这 个 脚本 。 它 包含 的 print 语句 散落 在 代码 各 个 地 方 ， 便 于 我 们 了 解 所 发 生 的 事情 : 





Z!/usr/bin/env python 
from time import ctime 


print '*** Welcome to Metaclasses!’ 
print '|tMetaclass declaration first. ’ 
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class MetaC(type): 
def init (cls, name, bases, attrd): 





super(MetaC, cls). init (name, bases, attrd) 
print '*** Created class Yr at: %s’ % (name, ctime (0) 


print '|tClass “Foo” declaration next.’ 


class Foo(object): 
J. metaclass | = MetaC 
def init (self): 
print '*** Instantiated class %r at: %s’ % ( 
self. class . name , ctime()) 





print '|tClass “Foo” instantiation next. ’ 
f = Fool 
print '|tDONE' 


当 我 们 执行 此 脚本 时 ， 将 得 到 以 下 输出 : 


xxx Welcome to Metaclasses! Metaclass declaration first. Class “Foo” declaration next. 
xxx Created class 'Foo! at: Tue May 16 14:25:53 2006 
Class “Foo” instantiation next. 

xxx Instantiated class 'Foo' at: Tue May 16 14:25:53 2006 

DONE 





当 你 明白 了 一 个 类 的 定义 其 实 是 在 完成 菜 些 工作 的 事实 以 后 ， 你 就 容易 理解 这 是 怎么 一 回 事情 











元 类 示例 2 


























在 第 二 个 示例 中 ， 我 们 将 创建 一 个 元 类 ， 要 求 程序 员 在 他 们 写 的 类 中 提供 一 个 _str 0 方法 的 
实现 ， 这 样 用 户 就 可 以 看 到 比 我 们 在 本 章 前 面 所 见 到 的 一 般 Py thon 对 象 字 符 串 (kobject object at 
id») 更 有 用 的 信息 。 














如 果 您 还 没有 在 类 中 稚 新 ”repr 0 方法 ， 元 类 会 (强烈) 提示 您 这 么 做 ， 但 这 只 是 个 警告 。 如 
HORS str. 0 方法 ， 将 引发 一 个 TypeError 的 异常 ， 要 求 用 户 编写 一 个 同名 方法 。 以 下 是 关于 
元 类 的 代码 : 























from warnings import warn 
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class ReqStrSugkepr (type): 





def init (cls, name, bases, attrd): 
super(ReqStrSugRepr, cls). init ( 
name, bases, attrd) 


if str ’ not in attrd: 


raise TypeError( Class requires overriding of | str 0°93) 


if ' repr / not in attrd: 


warn( Class suggests overriding of | repr ()\n’, stacklevel-3) 


我 们 编写 了 三 个 关于 元 类 的 示例 ， 其 中 一 个 (Foo) 重 载 了 特殊 方法 str OU repr 0, 男 一 
个 (Bar) 只 实现 了 特殊 方法 str QO， 还 有 一 个 (FooBar) 没 有 实现 str OA repr ()， 这 种 
情况 是 错误 的 。 完 整 的 程序 见 示例 13. 10. 








l 








执行 此 脚本 ， 我 们 得 到 如 下 输出 : 
$ python meta. py 
xxx Defined ReqStrSugRepr (meta)class 


xxx Defined Foo class 


sys:1: UserWarning: Class suggests overriding of 
. repr () 


xxx Defined Bar class 


Traceback (most recent call last): File “meta. py”, line 43, in ? 
class FooBar (object): 

File “meta. py”, line 12, in init . 

raise TypeError( 


TypeError: Class requires overriding of | str () 


示例 13.10 元 类 示例 (meta. py) 








这 个 模块 有 一 个 元 类 和 三 个 受 此 元 类 限定 的 类 。 每 创建 一 个 类 ， 将 打印 一 条 输出 语句 。 





Ig!/usr/bin/env python 
2 
3from warnings import warn 
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4 
5class RegStrSugRepr (type) : 
6 
7 def | init (cls, name, bases, attrd): 
8 super (ReqgStrSugRepr, cls). init ( 
9 name, bases, attrd) 
10 
77 if’ str ’ not in attrd: 
12 raise TypeError( 
13 “Class requires overriding of | str (0^) 
14 
15 if’ repr ^"^ not in attrd: 
16 warn ( 
17 'Class suggests overriding of | repr (|n, 
18 stacklevel-3) 
19 
20 print '*** Defined ReqStrSugRepr (meta)class|n' 
21 
22 class Foo(object): 
23 J. metaclass | = ReqStrSugRepr 
24 
25 def str (self): 
26 return 'Instance of class:’, 
27 self. class . name 
28 
29 def repr (self): 
30 return self. class . name 
31 
32 print '*** Defined Foo class|n' 
33 
34 class Bar (object): 
35 . Aetaclass | = ReqgStrSugRepr 
36 
37 def str (self): 
38 return 'Instance of class:’, 
39 self. class . name 
40 
4l print '*** Defined Bar class|n' 
42 


43 class FooBar (object): 
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44 J. metaclass | = ReqStrSugRepr 
45 
46 print '*** Defined FooBar class|n' 


注意 我 们 是 如 何 成 功 声 明 Foo 定义 的 ; 定义 Bar 时 ， 提 示警 告 _repr 0 未 实现 ，FooBar 的 创 
建 没 有 通过 安全 检查 ， 以 致 程 序 最 后 没有 打印 出 关于 FooBar 的 语句 。 另 外 要 注意 的 是 我 们 并 没有 创 
建 任何 测试 类 的 实例 . .. 这 些 甚 至 根本 不 包括 在 我 们 的 设计 中 。 但 别 忘 了 这 些 类 本 身 就 是 我 们 自己 
的 元 类 的 实例 。 这 个 示例 只 显示 了 元 类 强大 功能 的 一 方面 。 




















关于 元 类 的 在 线 文 档 众 多 ， 包 括 Python 文档 PEPs 252 和 253, (What' s New in Python 2.2) 
X4, Guido van Rossum 所 写 的 名 为 “Unifying Types and Classes in Python 2.2” 的 文章 。 在 
Python 2.2.3 发 布 的 主页 上 你 也 可 以 找到 相关 文档 的 链接 地 址 。 


13. 17 相关 模块 和 文档 


我 们 在 本 章 已 经 对 核心 语言 做 了 讲述 ， 而 Python 语言 中 有 几 个 扩展 了 核心 语言 功能 的 经 典 类 。 
这 些 类 为 Python 数据 类 型 的 子 类 化 提供 了 方便 。 























可 以 对 类 进行 定制 ， 这 样 当 对 一 个 标准 类 型 封装 时 ， 可 以 给 实例 带 来 和 类 型 一 样 的 使 用 效果 。 





模块 好 比 速 食品 ， 方 便 即食 。 我 们 曾 提 到 类 可 以 有 特殊 的 方法 ， 如 果实 现 了 这 些 特 殊 方 法 ， 就 


UserList 和 UserDict, 还 有 新 的 UserString( 从 Pythonl. 6 版 本 开始 引入 ) 分 别 代表 对 列表 、 字 
典 、 字 符 串 对 象 进行 封装 的 类 定义 模块 。 这 些 模 块 的 主要 用 处 是 提供 给 用 户 所 需要 的 功能 ， 这 样 你 
就 不 必 自 己 动手 去 实现 它们 了 ， 同 时 还 可 以 作为 基 类 ， 提 供 子 类 化 和 进一步 定制 的 功能 。Python if 
言 已 经 为 我 们 提供 了 大 量 有 用 的 内 建 类 型 ， 但 这 种 “由 你 自己 定制 “类 型 的 附加 功能 使 得 Python 语言 
更 加 强大 。 






































在 第 四 章 里 ， 我 们 介绍 了 Python 语言 的 标准 类 型 和 其 它 内 建 类 型 。types 模块 是 进一步 学 习 
Python 类 型 方面 知识 的 好 地 方 ， 其 中 的 一 些 内 容 已 超出 了 本 书 的 讨论 范围 。types 模块 还 定义 了 一 
些 可 以 用 于 进行 比较 操作 的 类 型 对 象 。 (这 种 比较 操作 在 Python 中 很 常见 ， 因 为 它 不 支持 方法 的 重 
载 - 这 简化 的 语言 本 身 ， 同 时 又 提供 了 一 些 工 具 ， 为 貌似 欠缺 的 地 方 添加 功能 . ) 






































下 面 的 代码 检查 传递 到 foo 函数 的 数据 对 象 是 否 是 一 个 整数 或 一 个 字符 串 ， 不 允许 其 他 类 型 出 
现 ( 否 则 会 引发 一 个 异常 ) : 


def foo(data): 
if isinstance(data, int): 
print 'you entered an integer’ 
elif isinstance (data, str): 
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* | * 


print 'you entered a string’ 





else: 
raise TypeError, 'only integers or strings!’ 














最 后 一 个 相关 模块 是 operator 模块 。 这 个 模块 提供 了 Python 中 大 多 数 标准 操作 符 的 函数 版 本 。 
在 某 些 情况 下 ， 这 种 接口 类 型 比 标准 操作 符 的 硬 编码 方式 更 通用 。 











请 看 下 边 的 示例 。 在 你 阅读 代码 时 ， 请 设想 一 下 如 果 此 实现 中 使 用 的 是 一 个 个 操作 符 的 话 ， 那 
会 多 写 多 少 行 代码 啊 ? 





225 from operator import *  # import all operators 
222 vecl = [12, 24] 
225 vee? = [2, 3, 4] 
22^ opvec = (add, sub, mul, div) # using t+ => * / 
>>> for eachOp in opvec: # loop thru operators 
for i in vecl: 
for j in vec2: 
print 'Ws(Wd, %d) = %d’ % | 
(eachOp. name, i, j, eachOp(i, j)) 


add(12. 2) = 14 
add(12, 3) = 15 
add(12, 4) = 16 
add (24, 2) = 26 
add (24, 3) = 27 
add (24, 4) = 28 
sub(12, 2) = 10 
sub(12, 3) = 9 

sub(12, 4) = 8 

sub (24, 2) = 22 
sub (24, 3) = 21 
sub (24, 4) = 20 
mul(12, 2) = 24 
mul (12, 3) = 36 
mul (12, 4) = 48 
mul (24, 2) = 48 
mul (24, 3) = 72 
mul (24, 4) = 96 
div (12, 2) = 6 

div(12 3) - 4 
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div (12, 4 =3 
div (24, 2) = I2 


div (24, 3) = 8 
div(24, 4) = 6 








上 面 这 段 代 码 定义 了 三 个 向 量 ， 前 两 个 包含 着 操作 数 ， 最 后 一 个 代表 程序 员 打 算 对 两 个 操作 数 
进行 的 一 系列 操作 。 最 外 层 循 环 吉 历 每 个 操作 运算 ， 而 最 内 层 的 两 个 循环 用 每 个 操作 数 向 量 中 的 元 
素 组 成 各 种 可 能 的 有 序数 据 对 。 最 后 ，print 语句 打印 出 将 当前 操作 符 应 用 在 给 定 参 数 上 所 得 的 运算 
结果 。 

















我 们 前 面 介绍 过 的 模块 都 列 在 表 13.5 中 


表 13.5 与 类 相关 的 模块 














模块 说 明 

UserList 提供 一 个 列表 对 象 的 封装 类 

UserDict 提供 一 个 字典 对 象 的 封装 类 

UserString” 提供 一 个 字符 串 对 象 的 封装 类 ; 它 又 包括 一 个 MutableString 子 类 ， 如 果 有 需 
要 ， 可 以 提供 有 关 功 能 

types 定义 所 有 Python 对 象 的 类 型 在 标准 Python 解释 器 中 的 名 字 

operator 标准 操作 符 的 函数 接口 


a. 新 出 现 于 Python 1.6 版 本 


在 Python FAQ 中 ， 有 许多 与 类 和 面向 对 象 编程 有 关 的 问题 。 它 对 Python 类 库 以 及 语言 参考 手 
册 都 是 很 好 的 补充 材料 。 关 于 新 风格 的 类 ， 请 参考 PEPs252 和 253 和 Python2. 2 以 后 的 相关 文档 。 





13.18 练习 
13-1. ”程序 设计 。 请 列举 一 些 面 向 对 象 编程 与 传统 旧 的 程序 设计 形式 相 比 的 先进 之 处 。 








13-2. ”函数 和 方法 的 比较 。 函 数 和 方法 之 间 的 区 别 是 什么 ? 


示例 13. 11 金额 转换 程序 (moneyfmt.py) 
字符 串 格 式 类 用 来 对 浮 点 数值 进行 “打包 “， 使 这 个 数值 显示 为 带 有 正 胡 


中 


< 
dl 











的 金额 。 





cw 
= 


Y 








1#!/usr/bin/env python 

2 

3class MoneyFmt (object): 

4def | init (self, value=0. 0): # constructor #fJ m 
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5self. value = float (value) 





6 

7def update(self, value=None): # allow updates AR tF ERK 
SHAH 

9ZZZ (a) complete this function 

10 "i 

il 


12 def repr (self): # display as a float HERA AH 
13 return 'self. value’ 


14 

15 def str (self): # formatted display BE TOLL MEAN 
16 wal =" 

17 

18 AAH 


19 HK (b) complete this function... do NOT 
20  "Hfffíorget about negative numbers!! 


Al — HH 

22 

23 return val 

24 

25 def | nonzero (self): # boolean test 
26 NR 

27 HH (c) find and fix the bug 

28 "HH 

29 


30 return int (self. value) 


You will find the code skeleton for moneyfmt.py presented as Example 13.11. You will 
find a fully documented (yet incomplete) version of moneyfmt. py on the Web site. If we were 
to import the completed class within the interpreter, execution should behave similar to 


the following: 


222 import moneyfmt 

2> 

222 cash = moneyfmt. MoneyFmt (123. 45) 
222 cash 

123. 45 

222^ print cash 

$123. 45 

p 
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>>> cash. update (100000. 4567) 
222 cash 

100000. 4567 

222 print cash 

$100, 000. 46 

222 

222^ cash. update 0. 3) 
222 cash 

=). 3 

>>> print cash 

-$0. 30 

2> repr (cash) 

"=o" 

222 cash’ 

"epa" 

22^ str (cash) 

"0 30° 





13-3. ”对 类 进行 定制 。 写 一 个 类 ， 用 来 将 浮 点 数值 转换 为 金额 。 在 本 练习 里 ， 我 们 使 用 美国 
货币 ， 但 读者 也 可 以 自选 任意 货币 。 

基本 任务 : 编写 一 个 dollarize( 〇 函数 ， 它 以 一 个 浮 点 数值 作为 输入 ， 返 回 一 个 字符 串 形式 的 
金额 数 。 比 如 说 : 

dollarize(1234567. 8901) ==> ‘$1, 234, 567. 89. 

dollarize (返回 的 金额 数 里 应 该 允许 有 逗号 (比如 1, 000, 000) ， 和 美元 的 货币 符号 。 如 果 有 负 
号 ， 它 必须 出 现在 美元 符号 的 左边 。 完 成 这 项 工作 后 ， 你 就 可 以 把 它 转换 成 一 个 有 用 的 类 ， 名 为 
MoneyFmt. 

MoneyFmt 类 里 只 有 一 个 数据 值 ( 即 , aD, 和 五 个 方法 (你 可 以 随意 编写 其 他 方法 )。 init 0 
构造 器 对 数据 进行 初始 化 ，update 0 方法 把 数据 值 蔡 换 成 一 个 新 值 ， nonzero 0 是 布尔 型 的 ， 当 
数据 值 非 零 时 返回 True, — repr. 0 方法 以 浮 点 数 的 形式 返回 金额 ;而 _str 0 方法 采用 和 
dollarize 一样 的 字符 格式 显示 该 值 。 

(a) 编写 update 0 方法， 以 实现 数据 值 的 修改 功能 。 

(b 以 你 已 经 编写 的 dollarize 0 的 代码 为 基础 ,编写 str 0 〇 方法 的 代码 

(c) 纠正 _nonzero 0 方法 中 的 错误 ,这 个 错误 认为 所 有 小 于 1 的 数值 ,例如 ,50 美 分 ($0. 50), 
返回 假 值 (False). 

(d) 附加 题 : 允许 用 户 通 过 一 个 可 选 参 数 指定 是 把 负数 数值 显示 在 一 对 尖 插 号 里 还 是 显示 一 个 
负 号 。 默 认 参 数 是 使 用 标准 的 负 号 。 





















































13-4. — 用户 注册 。 建 立 一 个 用 户 数据 库 (包括 登录 名 、 密 码 和 上 次 登录 时 间 惟 ) 类 (参考 练习 7-5 
和 9712) ， 来 管理 一 个 系统 ， 该 系统 要 求 用 户 在 登录 后 才能 访问 茶 些 资源 。 这 个 数据 库 类 对 用 户 进行 
管理 ， 并 在 实例 化 操作 时 加 载 之 前 保存 的 用 户 信 息 ， 提 供 访问 函数 来 添加 或 更 新 数据 库 的 信息 。 在 
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数据 修改 后 ， 数 据 库 会 在 垃圾 回收 时 将 新 信息 保存 到 磁盘 。( 参 见 _del 0). 





13-5. JUH. 创建 一 个 由 有 序数 值 对 (xz，y) 组 成 的 Point 类 ， 它 代表 某 个 点 的 X 坐 标 和 了 Y 坐 
标 。X 坐标 和 了 坐标 在 实例 化 时 被 传递 给 构造 器 ， 如 果 没 有 给 出 它们 的 值 ， 则 默认 为 坐标 的 原点 。 














13-6. JL. 创建 一 个 直线 /直线 段 类 。 除 主要 的 数据 属性 : 一 对 坐标 值 (参见 上 一 个 练习 ) 外 ， 
它 还 具有 长 度 和 和 斜 线 属 性 。 你 需要 履 盖 _repr 0 方法 (如 果 需 要 的 话 ， 还 有 str 0 方法 )， 使 得 
代表 那 条 直线 (或 直线 段 ) 的 字符 串 表 示 形 式 是 由 一 对 元 组 构成 的 元 组 ， 即 ，((xl，y1)， (x2, y2)). 


mM SE 


4C Es 









































_repr 将 直线 的 两 个 端点 (始点 和 止 点 ) 显示 成 一 对 元 组 
length 返回 直线 段 的 长 度 - 不 要 使 用 len”， 因 为 这 样 使 人 误解 它 是 整数 。 
slope 返回 此 直线 段 的 斜率 (或 在 适当 的 时 候 返 回 None) 








13-7. ”数据 类 。 提 供 一 个 time 模块 的 接口 ， 允 许 用 户 按照 自己 给 定时 间 的 格式 ， 比 如 : 
“MM/DD/YY, ”  *MM/DD/YYYY," “DD/MM/YY, ” “DD/MM/ YYYY,” “Mon DD, YYYY,” 或 是 标准 
的 Unix 日 期 格式 :“Day Mon DD, HH:MM:SS YYYY” 来 查看 日 期 。 你 的 类 应 该 维护 一 个 日 期 值 ， 并 
用 给 定 的 时 间 创 建 一 个 实例 。 如 果 没 有 给 出 时 间 值 ， 程 序 执行 时 会 默认 采用 当前 的 系统 时 间 。 还 包 
括 另 外 一 些 方法 : 

update O 按 给 定时 间或 是 默认 的 当前 系统 时 间 修 改 数据 值 

display) 以 代表 时 间 格 式 的 字符 串 做 参数 ， 并 按照 给 定时 间 的 格式 显示 : 





























MDY? ==> MM/DD/YY 
"MDYY ==> MM/DD/YYYY 
'DMY ==> DD/MM/YY 
'"DMYY ==> DD/MM/YYYY 
'MODYY' ==> Mon DD, YYYY 











如 果 没 有 提供 任何 时 间 格 式 ， 默 认 使 用 系统 时 间或 ctime O 的 格式 。 附 加 题 : 把 这 个 类 和 练习 
6-15 结合 起 来 。 











13-8. ”堆栈 类 。 一 个 堆栈 (Stack) 是 一 种 具有 后 进 先 出 (last-in-first-out，LIF0) 特性 的 数 
据 结 构 。 我 们 可 以 把 它 想象 成 一 个 餐 盘 架 。 最 先 放 上 去 的 盘子 将 是 最 后 一 个 取 下 来 的 ， 而 最 后 一 个 
放 上 去 的 盘子 是 最 先 被 取 下 来 的 。 你 的 类 中 应 该 有 push 0 〇 方法 ( 回 堆 栈 中 压 入 一 个 数据 项 ) 和 pop () 
方法 (从 堆栈 中 移出 一 个 数据 项 ) 。 还 有 一 个 叫 isempty O 的 布尔 方法 ， 如 果 堆 栈 是 空 的， 返回 布尔 值 
1, 否则 返回 0; 一 个 名 叫 peek 0 〇 的 方法 ， 取 出 堆栈 顶部 的 数据 项 ， 但 并 不 移 除 它 。 

















注意 ， 如 果 你 使 用 一 个 列表 来 实现 堆栈 ,那么 pop 0 方法 从 Pythonl. 5. 2 版 本 起 已 经 存在 了 。 那 
就 在 你 编写 的 新 类 里 ， 加 上 一 段 代码 检查 pop 0 方法 是 否 已 经 存在 。 如 果 经 检查 pop () 方 法 存在 ， 就 
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调用 这 个 内 建 的 方法 ， 否 则 就 执行 你 自己 编写 的 pop () 方 法 。 你 很 可 能 要 用 到 列表 对 象 , 如 果 用 到 它 
时 ， 不 需要 担心 实现 列表 的 功能 (例如 ， 切 片 ) 。 只 要 确保 你 写 的 堆栈 类 能 够 正确 实现 上 面 的 两 项 功 
能 就 可 以 了 。 你 可 以 用 列表 对 象 的 子 类 或 自己 写 个 类 似 列表 的 对 象 ， 请 参考 示例 6. 2. 






































13-9. 队列 类 。 一 个 队列 (queue) 是 一 种 具有 先进 先 出 (first-in-first-out, FIFO) 特性 的 数 
据 结构 。 一 个 队列 就 像 是 一 行 队伍 ， 数 据 从 前 端 被 移 除 ， 从 后 端 被 加 入 。 这 个 类 必须 支持 下 面 几 种 
方法 : 











enqueue() ”在 列表 的 尾部 加 入 一 个 新 的 元 素 
dequeue) ”在 列表 的 头 部 取出 一 个 元 素 ， 返 回 它 并 且 把 它 从 列表 中 删除 。 








请 参见 上 面 的 练习 和 示例 6. 3. 


13-10， “堆栈 和 队列 。 编 写 一 个 类 ， 定 义 一 个 能 够 同时 具有 堆栈 (FIF0) 和 队列 (LIPO) 操作 行为 
的 数据 结构 。 这 个 类 和 Perl 语言 中 数组 相像 。 需 要 实现 四 个 方法 ; 














shift () 返回 并 删除 列表 中 的 第 一 个 元 素 ， 类 似 于 前 面 的 dequeue 0 函数 。 
unshift() ”在 列表 的 头 部 “ 压 入 “一 个 新 元 素 

push) ”在 列表 的 尾部 加 上 一 个 新 元 素 ， 类 似 于 前 面 的 enqueue 0 和 push 0 方法 。 
pop () 返回 并 删除 列表 中 的 最 后 一 个 元 素 ， 与 前 面 的 pop 0 方法 完全 一 样 。 








请 参见 练习 13-8 和 13-9. 


13-11. ”电子 商务 。 

你 需要 为 一 家 B2C (商业 到 消费 者 ) 零售 商 编 写 一 个 基础 的 电子 商务 引擎 。 你 需要 写 一 个 针对 顾客 
的 类 User， 一 个 对 应 存货 清单 的 类 Item， 还 有 一 个 对 应 购物 车 的 类 叫 Cart， 货 物 放 到 购物 车 里 , 顾 
客 可 以 有 多 个 购物 车 。 同 时 购物 车 里 可 以 有 多 个 货物 ， 包 括 多 个 同样 的 货物 。 























13-12 MRE. 你 对 目前 的 聊天 室 程序 感到 非常 失望 ， 并 决心 要 自己 写 一 个 ， 创 建 一 家 新 的 
因特网 公司 ， 获 得 风险 投资 ， 把 广告 集成 到 你 的 聊天 室 程序 中 ， 争 取 在 6 个 月 的 时 间 里 让 收入 翻 五 
倍 ， 股 票 上 市 ， 然 后 退休 。 但 是 ， 如 果 你 没有 一 个 非常 酷 的 聊天 软件 ， 这 一 切 都 不 会 发 生 。 

















你 需要 三 个 类 : 一 个 Message 类 ， 它 包含 一 个 消息 字符 串 以 及 诸如 广播 、 单 方 收 件 人 等 其 他 信 
kL, —~ User 类 ， 包 含 了 进入 你 聊天 室 的 某 个 人 的 所 有 信息 .为 了 从 风险 投资 者 那里 拿 到 局 动 资金 ， 
你 加 了 一 个 Room X, 它 体 现 了 一 个 更 加 复杂 的 聊天 系统 , 用户 可 以 在 聊天 时 创建 单独 的 “聊天 屋 ”， 
并 邀请 其 他 人 加 入 。 附 加 题 : 请 为 用 户 开发 一 个 图 形 化 用 户 界面 应 用 程序 。 





























13-13. ”股票 投资 组 合 类 . 你 的 数据 库 中 记录 了 每 个 公司 的 名 字 ， 股 票 代号 ， 购 买 日 期 ， 购 买 
价格 和 持 股 数量 。 需 要 编写 的 方法 包括 : 添加 新 代号 (新 买 的 股票 )、 删 除 代 号 (所 有 卖 出 股票 )， 根 
据 当 前 价格 (及 日 期 ) 计 算出 的 YTD 或 年 回报 率 。 请 参见 练习 7-6. 
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13-14. DOS. 为 DOS 机 器 编写 一 个 UNIX 操作 界面 的 shel1。 你 向 用 户 提供 一 个 命令 行 ， 使 得 
用 户 可 以 在 那里 输入 Unix 命令 ， 你 可 以 对 这 些 命令 进行 解释 ， 并 返回 相应 的 输出 ， 例 如 :“1s” 命 
令 调用 “dir” 来 显示 一 个 目录 中 的 文件 列表 ,“more” 调 用 同名 命令 (分 页 显示 一 个 文件 ),“cat” 调 
用 "type," “cp” 调用 “copy, ” “mv” 调用 "ren," “rm” 调用 “del,” 等 . 











13-15. 授权。 示例 13. 8 的 执行 结果 表明 我 们 的 类 CapOpen 能 成 功 完成 数据 的 写 入 操作 。 在 
我 们 的 最 后 评论 中 ， 提 到 可 以 使 用 CapOpen() 或 open O) 来 读 取 文 件 中 的 文本 。 为 什么 呢 ? 这 两 者 使 
用 起 来 有 什么 差异 吗 ? 





13-16. ”授权 和 函数 编程 。 
(a) 请 为 示例 13. 8 中 的 CapOpen 类 编写 一 个 writelines 0 方法。 这 个 新 函数 将 可 以 一 次 读 入 
多 行文 本 ,然后 将 文本 数据 转换 成 大 写 的 形式 , 它 与 write (0 方法 的 区 别 和 通常 意思 上 的 writelines () 
与 write (方法 之 间 的 区 别 相似 ,注意 : 编写 完 这 个 方法 后 , writelines (将 不 再 由 文件 对 象 “ 代 理 ”。 
(b) 在 writelines (方法 中 添加 一 个 参数 ， 用 这 个 参数 来 指明 是 否 需 要 为 每 行文 本 加 上 一 个 
换行 符 。 此 参数 的 默认 值 是 False, 表示 不 加 换行 符 。 



































13-17. ”数值 类 型 子 类 化 。 在 示例 13. 3 中 所 看 到 的 moneyfmt. py 脚本 基础 上 修改 它 ， 使 得 它 
可 以 扩展 Python 的 浮 点 类 型 。 请 确保 它 支持 所 有 操作 ， 而 且 是 不 可 变 的 。 




















13-18. ”序列 类 型 子 类 化 。 模 仿 前 面 练习 13-4 中 的 用 户 注 册 类 的 解决 方案 ， 编 写 一 个 子 类 。 
要 求 允许 用 户 修 改 密码 ， 但 密码 的 有 效 期 限 是 12 个 月 ， 过 期 后 不 能 重复 使 用 。 附 加 题 : 支持 “ 相 
似 密码 ”检测 的 功能 (任何 算法 皆 可 )， 不 允许 用 户 使 用 与 之 前 12 个 月 期 间 所 使 用 的 密码 相似 的 任何 


密码 。 











13-19. ”映射 类 型 子 类 化 。 假 设 在 13.11. 3 节 中 字典 的 子 类 ， 若 将 keys 0 方法 重 写 为 : 


def keys(self): 
return sorted (self. keys ()) 


(a) What happens when keys() is called for a method? 
(a) “ 当 方法 keys 0 被 调用 ， 结 果 如 何 ? 
(b) VWhy is this, and what makes our original solution work? 


(b) ”为 什么 会 有 这 样 的 结果 ?如 何 使 我 们 的 原 解决 方案 顺利 工作 ? 








13-20. ”类 的 定制 。 改 进 脚本 time60. py, JL 13. 13. 2 节 ， 示 例 13. 3. 

(a) 允许 “ 空 ” 实 例 化 : 如 果 小 时 和 分 钟 的 值 没 有 给 出 ， 默 认为 零 小 时 、 零 分 钟 。 

(b) “用 零 占 位 组 成 两 位 数 的 表示 形式 , 因为 当前 的 时 间 格 式 不 符合 要 求 。 如 下 面 的 示例 ，wed 
应 该 输出 为 “12:05. " 





























Edit By Vheavens 


t 





Edit By Vheavens 


ee 
T | 


22» wed = Time60(12, 5) 

25^ wed 

12:5 

(c) BR f Hl hours (hr) 和 minutes (min) 进 行 初始 化 外 ， 还 支持 以 下 时 间 输 入 格式 : 

e 一 个 由 小 时 和 分 钟 组 成 的 元 组 (10，30) 

e 一 个 由 小 时 和 分 钟 组 成 的 字典 (fpr : 10, min’: 30}) 

e 一 个 代表 小 时 和 分 钟 的 字符 串 (“10:30”) 

附加 题 : 允许 不 恰当 的 时 间 字 符 串 表示 形式 ， 如 “12:5”. 

(d ”我 们 是 否 需 要 实现 radd 0 方法 ?为 什么 ?如 果 不 必 实现 此 方法 ， 那 我 们 什么 时 候 可 
以 或 应 该 覆盖 它 ? 

(e) repr _ 0 函数 的 实现 是 有 缺陷 而 且 被 误导 的 。 我 们 只 是 重 载 了 此 函数 ， 这 样 我 们 可 以 省 
去 使 用 print 语句 的 麻烦 ， 使 它 在 解释 器 中 很 好 的 显示 出 来 。 但 是 ， 这 个 违背 了 一 个 原则 :对 于 可 估 
值 的 Python 表达 式 ，repr 0 总 是 应 该 给 出 一 个 (有 效 的 ) 字符 串 表 示 形 式 。12:05 本 身 不 是 一 个 合法 
的 Python 表达 式 ， 但 Time60( 12:05 ) 是 合法 的 。 请 实现 它 。 

(f) 添加 六 十 进 制 ( 基 数 是 60) 的 运算 功能 。 下 面 示例 中 的 输出 应 该 是 19:15， 而 不 是 18:75: 

225 thu = Time60(10, 30) 

2M» fri = Time60(8, 45) 

222 thu + fri 

18:75 
































13-21. 装饰 符 和 函数 调用 语法 。 第 13.16. 4 节 末 尾 ， 我 们 使 用 过 一 个 装饰 函数 符 把 x 转化 成 一 
个 属性 对 象 ， 但 由 于 装饰 符 是 Python2. 4 才 有 的 新 功能 ， 我 们 给 出 了 另 一 个 适用 于 旧版 本 的 语法 : 








X = property (**x()). 


执行 这 个 赋值 语句 时 到 底 发 生 了 什么 呢 ? 为 什么 它 和 使 用 装饰 符 语 句 是 等 价 的 ? 
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章 主题 

可 调用 对 象 
代码 对 象 
语句 和 内 置 函数 
执行 其 他 程序 
终止 执行 

各 类 操作 系统 接口 
相关 模块 
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Chapter 1 | 


在 python 中 有 多 种 运行 外 部 程序 的 方法 ， 比 如 ， 运 行 操作 系统 命令 或 另外 的 python 脚本 ， 或 
执行 一 个 磁盘 上 的 文件 ， 或 通过 网 络 来 运行 文件 。 这 完全 取决 于 你 想 要 干什么 。 有 些 特定 的 执行 场 
景 包括 : 


t 1 


在 当前 脚本 继续 运行 
创建 和 管理 子 进程 
执行 外 部 命令 或 程序 
执行 需要 输入 的 命令 
通过 网 络 来 调用 命令 

执行 命令 来 创建 需要 处 理 的 输出 

执行 其 他 的 Python 脚本 

执行 一 系列 动态 生成 的 Python 语句 
导入 Python 模块 (和 执行 它 顶 层 的 代码 ) 








































































































python 中 ， 内 建 和 外 部 模块 都 可 以 提供 上 述 各 种 功能 。 程 序 员 得 根据 实现 的 需要 ， 从 这 些 模块 
中 选择 合适 的 处 理 方法 。 本 章 将 对 python 执行 环境 进行 全 面 的 描述 ， 但 不 会 涉及 如 何 启 动 python 
解释 器 和 不 同 的 命令 行 选项 。 读 者 可 以 从 第 二 章 中 查阅 到 相关 信息 。 

















我 们 的 python 执行 环境 之 旅 从 可 调用 对 象 开 始 ， 接 着 是 代码 对 象 ， 然 后 去 看 看 什么 样 的 python 
语句 和 内 建 函 数 适合 支持 我 们 需要 的 功能 。 执 行 其 他 程序 的 能 力 不 仅 大 大 增强 了 python 脚本 的 威力 ， 
也 节约 了 资源 ， 因 为 重复 实现 这 些 代码 肯定 是 不 合 逻 辑 的 ， 更 是 浪费 时 间 和 人 力 。python 给 当前 脚 
本 环境 提供 了 许多 执行 程序 或 者 外 部 命令 的 机 制 ， 我 们 将 介绍 下 最 普遍 的 几 个 命令 。 接 下 来 ， 我 们 















































E 














Edit By Vheavens 


Edit By Vheavens 





ee 


对 python 的 受 限 执行 环境 作 一 个 简短 的 概况 ， 最 后 ， 介 绍 下 各 种 终止 执行 的 方法 〈 而 不 是 让 程序 正 
常 完 成 )。 就 从 可 调用 对 象 开 始 我 们 的 旅程 吧 。 








14.1 可 调用 对 象 


许多 的 python 对 象 都 是 我 们 所 说 的 可 调用 的 , 即 是 任何 能 通过 函数 操作 符 “()” 来 调用 的 对 象 。 
要 调用 可 调用 对 象 ， 函 数 操 作 符 得 紧 跟 在 可 调用 对 象 之 后 。 比 方 说 ， 用 “foo( ”来 调用 函数 “foo”。 
可 调用 对 象 可 以 通过 函数 式 编程 接口 来 进行 调用 ， 如 applyQ, filter, map), WAR reduce(), 3X 
四 个 接口 我 们 都 在 11 章 讨 论 过 了 。 Python 有 4 种 可 调用 对 象 : 函数 , 方法 , 类 , 以 及 一 些 类 的 实例 。 
记 住 这 些 对 象 的 任何 引用 或 者 别名 都 是 可 调用 的 。 
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14. 1. 1 函数 





我 们 介绍 的 第 一 种 可 调用 的 对 象 是 函数 .python 有 3 种 不 同类 型 函数 对 象 。 第 一 种 是 内 建 函 数 。 





内 建 函 数 CBIFs) 





一 部 分 加 载 进 系统 。 如 前 面 章节 所 提 到 的 ， 这 些 函 数 在 _bulitin MERE, FEN builtins 模 


BIF 是 用 c/c+t+ 写 的 ， 编 译 过 后 放 入 python 解释 器 ， 然 后 把 它们 作为 第 一 《内 建 ) 名 字 空 间 的 
块 导 入 到 解释 器 中 。 


表 14.1 内 建 函 数 属性 

















BIF 属性 描述 

bib. doc 文档 字符 串 (或 None) 

bif. name _ 字符 串 类 型 的 文档 名 字 

bif. self WHA None. CRERZS built-in 方法 ) 
bif. module . 存放 bif 定义 的 模块 名 字 (或 None) 








BIF 有 基础 类 型 属性 ， 其 中 一 些 独特 的 属性 已 列 在 表 14. 1 中 
你 可 以 用 dir0 列 出 函数 的 所 有 属性 : 








222» dir (type) 
[’ call ', ' class ', ' cmp ’, ' delattr °, ' doe ， 











” getattribute ^", ' hash ’, ' init’, ' module ^, 





2 A P P4 3 P4 3 
name, new, reduce ^, _ reduce ex _ , 





repr °, '" self ^", ' setattr ', ' str "J 
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访问 。 可 以 用 func. closure JB EREE EE th a7 x& SCY JB 








Edit By Vheavens 





T 








从 内 部 机 制 来 看 , 因为 BIFs 和 内 建 方法 (BIMs) 属于 相同 的 类 型 ,所 以 对 BIF 或 者 BIM 调 用 type 0 
的 结果 是 : 


2252 type (dir) 





«type “builtin function or method’ > 








注意 这 不 能 应 用 于 工厂 函数 ， 因 为 type O 正好 会 返回 产生 对 象 的 类 型 : 


2252 type (int) 
«type 'type'^ 
225» type (type) 
«type 'type'^ 


用 户 定义 的 函数 (UDF) 


UDF (User-Defined Function, 用 户 定 义 的 函数 ) 通常 是 用 python 写 的 ,定义 在 模块 的 最 高 级 ， 
因此 会 作为 全 局 名 字 空 间 的 一 部 分 (一旦 创建 好 内 建 名 字 空 间 ) 装载 到 系统 中 。 函 数 也 可 在 其 他 的 函 
数 体 内 定义 ， 并 且 由 于 在 2.2 中 和 嵌 套 作用 域 的 改进 ， 我 们 现在 可 以 对 多 重 向 套 作用 域 中 的 属性 进行 














—= 


Hs 











: 表 14.2 用 户 自 定义 函数 属性 








UDF 属性 
udf. doc . 


udf. name - 





udf. func code 
udf. func defaults 
udf. func globals 
udf. func dict 
udf. func doc 

udf. func name 
udf. func closure 


描述 

文档 字符 串 (也 可 以 用 udf. fune. doc) 

字符 串 类 型 的 函数 名 字 (也 可 以 用 udf. func. name) 

字 节 编译 的 代码 对 象 

默认 的 参数 元 组 

全 局 名 字 空 间 字 典 ;， 和 从 函数 内 部 调用 globals (x) 一 样 
函数 属性 的 名 字 空 间 

( 见 上 面 的 udf. doc ) 

( 见 上 面 的 udf. name ) 

包含 了 自由 变量 的 引用 的 单元 对 象 元 组 (自用 变量 在 UDF 中 使 用 ， 但 在 别 

处 定义 ; 参见 bython[ 语 言 ] 参 考 手册 ) 


























如 同上 面 的 BIFs, UDF 也 有 许多 的 属性 。UDF 最 让 人 感 兴趣 和 最 特殊 的 属性 都 列 在 下 面 的 表 14. 2 








从 内 部 机 制 来 看 ， 用 户 自 定义 的 函数 是 “函数 “类 型 的 ， 如 在 下 面 的 例子 中 用 type 0 表明 的 一 
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er D 
T def foo(): pass i T 


22^» type (foo) 
«type ° function’ > 


lambda 表达 式 和 用 户 自 定 义 对 函数 相 比 ， 略 有 不 同 。 虽 然 它 们 也 是 返回 一 个 函数 对 象 ， 但 是 
lambda 表达 式 不 是 用 def 语句 创建 的 ， 而 是 用 lambda 关键 字 : 





























因为 lambda 表达 式 没有 给 命名 绑 定 的 代码 提供 基础 结构 ， 所 以 要 通过 函数 式 编 程 接口 来 调用 ， 
或 把 它们 的 引用 赋值 给 一 个 变量 ， 然 后 就 可 以 直接 调用 或 者 再 通过 函数 来 调用 。 变 量 仅 是 个 别名 ， 
并 不 是 函数 对 象 的 名 字 。 




















通过 Lambda 来 创建 函数 的 对 象 除了 没有 命名 之 外 ,享有 和 用 户 自 定义 函数 相同 的 属性 ;_name 
或 者 func_name 属性 给 定 为 字符 串 “lambda>“。 使 用 type 0 〇 工厂 函数 ， 我们 来 演示 下 lambda 表达 式 
返回 和 用 户 自 定义 函数 相同 的 函数 对 象 。 




















>>> lambdaFunc = lambda x: x * 2 
>>> lambdaFunc (100) 

200 

>> type (lambdaFunc) 


«type ’ function’ > 
在 上 面 的 例子 中 ， 我 们 将 表达 式 赋值 给 一 个 别名 。 我 们 也 可 以 直接 在 一 个 lambda 表达 式 上 调 
用 type 0: 


25» type (lambda: 1) 
«type ° function’ > 


我 们 快速 的 来 看 看 UDF 名 字 ， 使 用 上 面 的 lambdaFunc 和 先前 小 节 中 的 foo Q : 


222 foo. name - 

’ foo’ 

225 lambdaFunc. name _ 
"KCambda^* 





从 11.9 小 节 中 我 们 可 以 看 到 ， 一 旦 函数 声明 以 后 〈 且 函数 对 象 可 用 )， 程 序 员 也 可 以 自 定义 函 
数 属性 。 所 有 的 新 属性 变 成 udf. dict_ 对象 的 一 部 分 。 在 本 章 的 稍 后 内 容 中 ， 我 们 将 讨论 获取 合 
有 python 代码 的 字符 串 并 执行 该 代码 。 到 了 本 章 最 后 ， 会 有 一 个 组 合 例子 ， 着 重 描写 函数 属性 和 
python 代码 (字符 串 ) 的 动态 求 值 和 执行 语句 。 
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14. 1. 2 方法 

















在 13 章 ， 我 们 研究 了 方法 。 用 户 自 定义 方法 是 被 定义 为 类 的 一 部 分 的 函数 。 许 多 python 数据 
类 型 ， 比 如 列表 和 字典 ， 也 有 方法 ， 这 些 被 称 为 内 建 方法 。 为 了 进一步 说 明 “ 所 有 权 “ 的 类 型 ， 方 
法 通过 对 象 的 名 字 和 句点 属性 标识 进行 命名 。 





























14.3 内 建 方法 BM) 属性 








BIM 属性 描述 
bim. doc . 文档 字 串 





bim. name _ 字符 串 类 型 的 函数 名 字 
bim self RERNA 





内 建 方法 (BIMs) 








在 前 面 的 小 节 中 ,我 们 讨论 了 内 建 方法 与 内 建 函 数 的 类 似 之 处 。 只 有 内 建 类 型 BIT) 有 BIM. 正如 
你 在 下 面 看 到 的 ， 对 于 内 建 方 法 ，type 0 工厂 函数 给 出 了 和 BIF 相同 的 输出 -- 注 意 ， 我 们 是 如 何 提 
供 一 个 内 建 对 象 来 访问 BIM: 



































22^ type (LJ. append) 
«type “builtin function or method’ > 











此 外 ，BIM 和 BIF 两 者 也 都 享有 相同 属性 。 不 同 之 处 在 于 BIM HJ self 属性 指 疝 一 个 Python 
对 象 ， 而 BIF 指向 None。 











对 于 类 和 实例 ， 都 能 以 该 对 象 为 参数 ， 通 过 内 建 函 数 dir 0 〇 来 获得 他 们 的 数据 和 方法 属性 。 这 也 
可 以 用 在 BIM 上 : 





25» dir ([]. append) 
[. call ', ' class ', ' comp ’, ' delattr °, ' doe ， 
^ getattribute ^", ' hash ', ' init ’, ' module ^, 








2 a 2 2 2 2 
name, new, reduce ^, __reduce_ex_, 





repr, 7" self C. "Oo setattr ^, ^ str ”J 











然而 ， 不 用 多 入 就 会 发 现 ， 从 功能 上 看 ， 用 实际 的 对 象 去 访问 其 方法 并 不 是 非常 有 用 ， 如 最 后 
的 例子 。 由 于 没有 引用 来 保存 这 个 对 象 ， 所 以 它 立 即 被 垃圾 回收 了 。 你 处 理 这 种 访问 的 类 型 唯一 的 














用 处 就 是 显示 BIT 有 什么 方法 。 


E 











$— 一 * 一 





Edit By Vheavens 


Edit By Vheavens 


ee 
T | 


用 户 定 义 的 方法 (UDM) 














UDM (User-defined method, 用 户 定义 的 方法 ) 包含 在 类 定义 之 中 , 只 是 拥有 标准 函数 的 包装 ， 
仅 有 定义 它们 的 类 可 以 使 用 。 如 果 没 有 在 子 类 定义 中 被 覆盖 掉 ， 也 可 以 通过 子 类 实例 来 调用 它们 。 
正如 在 13 章 解 释 的 那样 ， UDM 与 类 对 象 是 关联 的 〈 非 绑 定 方法 )， 但 是 只 能 通过 类 的 实例 来 调用 CA 
定 方法 )。 无 论 UDMs 是 否 绑 定 ， 所 有 的 UMD 都 是 相同 的 类 型 一 一 “实例 方法 “， 如 在 下 面 例子 看 到 
的 type O 调用 : 

















22» class C(object): # define class # EKA 
def foo(self): pass # define UDM # XE Xx UDM 


2 c = CO # instantiation # SH 
»» type(C) # type of class # 类 WJ 类 BD) 
«type 'type'^ 
22» type(c) # type of instance # ZPP 
<class ' main .C'^ 
22» type (C. foo) # type of unbound method # JERKED EHI 
«type 'instancemethod' > 
>>> type(c.foo) # type of bound method # HEZEEN 
«type 'instancemethod'^ 














X 11.4 中 展示 了 UDM 的 属性 。 访 问 对 象 本 身 将 会 揭示 你 正在 引用 一 个 绑 定 方法 还 是 非 绑 定 方 
法 。 正 如 你 从 下 面 看 到 的 ， 绑 定 的 方法 揭示 了 方法 绑 定 到 哪 一 个 实例 。 











> C. foo # unbound method object # JESWiE Zr 
<unbound method C. foo» 

p 

2» c. foo # bound method object # BETZ R 

<bound method C. foo of < main .C object at Ox00B42DD) 
2^c £4 instance foo()'s bound to # foo) LWRAEFR 
€ main .C object at OxOO0B42DDO^ 











# 14.4 用 户 自 定义 属性 





























UDM 属性 描述 

udm. doc - 文档 字符 串 〈 与 udm. im fuc. doc 相同) 

udm. name - 字符 串 类 型 的 方法 名 字 CE umd. im func. name 相同 ) 

udm module 定义 udm 的 模块 的 名 字 (或 none) 

udm. im class 方法 相关 联 的 类 (对 于 绑 定 的 方法 ; 如 果 是 非 绑 定 , 那么 为 要 求 udm 的 类 ) 
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udm. im func 方法 的 函数 对 象 〈 见 UDF s ) 
udm. im self 如 果 绑 定 的 话 为 相关 联 的 实例 ， 如 果 非 绑 定位 为 none 


+6 











14. 1. 3 类 











我 们 可 以 利用 类 的 可 调用 性 来 创建 实例 。“ 调 用 ”类 的 结果 便 是 创建 了 实例 ， 即 大 家 所 知道 的 实 
例 化 。 类 有 默认 构造 函数 ， 该 函数 什么 都 不 做 ， 基 本 上 只 有 一 个 pass 语句 。 程 序 员 可 以 通过 实现 
int (0 方 法， 来 自 定义 实例 化 过 程 。 实 例 化 调用 的 任何 参数 都 会 传 入 到 构造 函数 里 。 



































22^ class C(object) : 
def init (self, *args): 
print 'Instantiated with these arguments:|n', args 


2» cl = CO # invoking class to instantiate cl 
Instantiated with these arguments: 


0 


> c2 = C( The number of the counting shall be’, 3) Instantiated with these arguments: 


( The number of the counting shall be', 3) 
$ 34 165 AE EIS SEILER EC FEM A SERA, TEXX UEBER. AE, BAY E . 
如 何 让 实例 能 够 被 调用 。 


14. 1. 4 类 的 实例 








python 给 类 提供 了 名 为 call 的 特别 方法 ， 该 方法 允许 程序 员 创建 可 调用 的 对 象 〈 实 例 )。 默 
认 情 况 下 ，_ call 0 方法 是 没有 实现 的 ， 这 意味 着 大 多 数 实例 都 是 不 可 调用 的 。 然 而 ， 如 果 在 类 
定义 中 覆盖 了 这 个 方法 ， 那 么 这 个 类 的 实例 束 成 为 可 调用 的 了 。 调 用 这 样 的 实例 对 象 等 同 于 调用 
. call 0 方法。 自然 地 , 任何 在 实例 调用 中 给 出 的 参数 都 会 被 传 入 到 _cal10 中 。…… 那么 fooQ 
就 和 foo. call (foo) 的 效果 相同 ， 这 里 foo 也 作为 参数 出 现 ， 因 为 是 对 自己 的 引用 ， 实 例 将 自 
动 成 为 每 次 方法 调用 的 第 一 个 参数 。 如 果 call OQOABR, eo, (self, arg), 那么 foo (arg) 
就 和 调用 foo. call (foo，arg) 一 样 。 这 里 我 们 给 出 一 个 可 调用 实例 的 例子 ， 和 前 面 小 节 的 例子 


相似 : 


























22»? class C(object) : 
def call (self, *args): 
print “I’m callable! Called with args:|n^, args 











$— E 
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2> C= 

CO 

# instantiation  £ SHE 
252 c 


# our instance # FEATS 

€ main .C instance at OxOOB4ZDDO» 

22» callable(c) # instance is callable &ESUfflzà nf B fü 
True 

>>> c0 # instance invoked # JB/HSEffl 

I’m callable! Called with arguments: 

0 

22» c(3) f invoked with 1 arg # ISEBIBUIN fia MI -TER 
I'm callable! Called with arguments: 

(3,) 

22» c(3, no more, no less’) # invoked with 2 args # IFMIIIN Ze HATER 
I'm callable! Called with arguments: 

(3, “no more, no less’) 








记 住 只 有 定义 类 的 时 候 实 现 了 _call_ 方 法， 类 的 实例 才能 成 为 可 调用 的 。 


14. 2 代码 对 象 














可 调用 的 对 象 是 python 执行 环境 里 最 重要 的 部 分 , 然而 他 们 只 是 冰山 一 角 。python 语句 , 赋值 ， 
表达 式 ， 甚 至 还 有 模块 构成 了 更 宏大 的 场面 。 这 些 可 执行 对 象 无 法 像 可 调用 物 那 样 被 调用 。 更 确切 
地 说 ， 这 些 对 象 只 是 构成 可 执行 代码 块 的 拼图 的 很 小 一 部 分 ， 而 这 些 代 码 块 被 称 为 代码 对 象 。 

















每 个 可 调用 物 的 核心 都 是 代码 对 象 ， 由 语句 ， 赋 值 ， 表 达 式 ， 以 及 其 他 可 调用 物 组 成 。 察 看 一 
个 模块 意味 着 观察 一 个 较 大 的 、 包 含 了 模块 中 所 有 代码 的 对 象 。 然 后 代码 可 以 分 成 语句 ， 赋 值 ， 表 
达 式 ， 以 及 可 调用 物 。 可 调用 物 又 可 以 递归 分 解 到 下 一 层 ， 那 儿 有 自己 的 代码 对 象 。 











一 般 说 来 ， 代 码 对 象 可 以 作为 函数 或 者 方法 调用 的 一 部 分 来 执行 ， 也 可 用 exec 语句 或 内 建 函 数 
eval() 来 执行 。 从 整体 上 看 ， 一 个 python 模块 的 代码 对 象 是 构成 该 模块 的 全 部 代码 。 








如 果 要 执行 python 代码 ， 那 么 该 代码 必须 先 要 转换 成 字 贡 编 译 的 代码 〈 叉 称 字 节 码 )。 这 才 是 
真正 的 代码 对 象 。 然 而 ， 它 们 不 包含 任何 关于 它们 执行 环境 的 信息 ， 这 便 是 可 调用 物 存 在 的 原因 ， 
它 被 用 来 包装 一 个 代码 对 象 并 提供 额外 的 信息 。 

















还 记得 前 面 的 小 节 中 UDF 的 udf. func code 属性 吗 ? Wu, AER? 那 就 是 代码 对 象 。UDM 的 
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udm. im func 函数 对 象 又 是 怎么 一 回 事 呢 ? 因为 那 也 是 一 个 函数 对 象 ， 所 以 他 同样 有 它 自 己 的 
udm. im func. func code 代码 对 象 。 这 样 的 话 ， 你 会 发 现 ， 函 数 对 象 仅 是 代码 对 象 的 包装 ， 方 法 则 是 
给 函数 对 象 的 包装 。 你 可 以 到 处 看 看 。 当 研究 到 最 底层 ， 你 会 发 现 便 是 一 个 代码 对 象 




















14. 3 可 执行 的 对 象 声 明 和 内 建 函 数 

















Python 提供 了 大 量 的 BIF 来 支持 可 调用 /可 执行 对 象 ， 其 中 包括 exec 语句 。 这 些 函 数 帮助 程序 
员 执 行 代 码 对 象 ， 也 可 以 用 内 建 函 数 complie 0 来 生成 代码 对 象 。 





表 14.5 可 执行 对 象 和 内 建 函 数 


























内 建 函 数 和 语句 描述 
cal lable (obj) 如 果 obj 可 调用 ， 返 回 True， 和 否则 返回 FALSE 
compile (string, file, type) M type 类 型 中 创建 代码 对 象 ; file 是 代码 存放 的 地 方 〈 通 常设 
J^) 
eval (obj, glo- bals=globals(), 
locals=locals()) 对 obj PETRA, obj 是 已 编译 为 代码 对 象 的 表达 式 , 或 是 一 个 
字符 串 表达 式 ， 可 以 给 出 全 局 或 者 /和 局 部 的 名 字 空 间 
exec obj 执行 obj、 单 一 的 python 语句 或 者 语句 的 集合 ， 也 就 是 说 格式 
是 代码 对 象 或 者 字符 串 ，obj 也 可 以 是 一 个 文件 对 象 〈 已 经 打开 的 有 
效 python 脚本 中 ) 
input (prompt=’ ’ ) 等 同 于 eval (raw input (prompt=” )) 


14.3.1 callableQ 














callable 0 是 一 个 布尔 函数 ， 确 定 一 个 对 象 是 否 可 以 通过 函数 操作 符 ((O ) 来 调用 。 如 果 函 数 可 
调用 便 返 回 True， 和 否则 便 是 False (对 与 2. 2 和 较 早 的 版 本 而 言 ， 分 别 是 1 和 0)。 这 里 有 些 对 象 及 
其 对 应 的 callable 返回 值 

















2» callable(dir) # built-in function # ARH 


True 
2» callable(1)# integer ##H 
False 


22^ def foo(): pass 


> callable(foo) # user-defined function # HF HEX mz 
True 
222 callable ( bar’) # string #FIJA 
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False 
22» class C(object): pass 





>> callable(C) # class #3% 
True 


14.3.2 compile() 





compile () 函数 允许 程序 员 在 运行 时 刻 迅 速生 成 代码 对 象 ， 然 后 就 可 以 用 exec 语句 或 者 内 建 函 
Bl eval 0 来 执行 这 些 对 象 或 者 对 它们 进行 求 值 。 一 个 很 重要 的 观点 是 : exec 和 eval O 都 可 以 执行 字 
符 串 格式 的 Python 代码 。 当 执行 字符 串 形 式 的 代码 时 ， 每 次 都 必须 对 这 些 代 码 进行 字 节 编译 处 理 。 
compile O 函数 提供 了 一 次 性 字 节 代码 预 编译 ， 以 后 每 次 调用 的 时 候 ， 都 不 用 编译 了 。 



































compile 的 三 个 参数 都 是 必需 的 ， 第 一 参数 代表 了 要 编译 的 python 代码 。 第 二 个 字符 串 ， 虽 然 
是 必需 的 ,但 通常 被 置 为 空 串 。 该 参数 代表 了 存放 代码 对 象 的 文件 的 名 字 (字符 串 类 型 )。compile 的 
通常 用 法 是 动态 生成 字符 串 形式 的 Python 代码 ， 然后 生成 一 个 代码 对 象 一 一 代码 显然 没有 存放 在 
任何 文件 。 











最 后 的 参数 是 个 字符 串 ， 它 用 来 表明 代码 对 象 的 类 型 。 有 三 个 可 能 值 : 


eval’ 可 求 值 的 表达 式 [ 和 eval O 一 起 使 用 ] 
'single ”单一 可 执行 语句 [和 exec 一 起 使 用 ] 
' exec’ 可 执行 语句 组 [和 exec 一 起 使 用 ] 


可 求 值 表达 式 


22» eval code = compile( 100 + 200', °’, eval’) 
22^ eval (eval code) 
300 


单一 可 执行 语句 

2» single code = compile( print “Hello world!^, '', 'single') 
22^ single code 

<code object ? at 120998, file ^^, line 0» 

25^ exec single code 

Hello world! 


可 执行 语句 组 





$— 一 * 一 
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2> exec code = compile( 
. req = input ( Count how many numbers? ') 
. for eachNum in range (req): 
print eachNum 
^^ 93 I exec!) 
22^ exec exec code 
Count how many numbers? 6 


MDH & hb KR SD 


在 最 后 的 例子 中 , 我 们 第 一 次 看 到 input 0 。 一 直 以 来 , 我 们 都 是 从 raw_input O 中 读 取 输入 的 。 
内 建 函 数 input 0 是 我 们 将 在 本 章 稍 后 讨论 的 一 个 快捷 函数 。 








14.3.3 evalQ + 
* eval O 对 表达 式 求 值 ， 后 者 可 以 为 字符 串 或 内 建 函 数 complie (创建 的 预 编译 代码 对 象 。 这 是 
eval 0 第 一 个 也 是 最 重要 的 参数 . . ...….. 这 便 是 你 想 要 执行 的 对 象 。 第 二 个 和 第 三 个 参数 ， 都 为 可 选 
的 , 分 别 代表 了 全 局 和 局 部 名 字 空 间 中 的 对 象 。 如 果 给 出 这 两 个 参数 , globals 必须 是 个 字典 , locals 
可 以 是 任意 的 映射 对 象 ， 比 如 ， 一 个 实现 了 getitem 0 方法 的 对 象 。( 在 2.4 之 前 ，local 必须 是 
一 个 字典 ) 如 果 都 没 给 出 这 两 个 参数 ， 分 别 默 认为 globals OI locals 0 返回 的 对 象 ， 如 果 只 传 入 
了 一 个 全 局 字典 ， 那 么 该 字典 也 作为 locals 传 入 。 好 了 ， 我 们 一 起 来 看 看 eval () : 




















2» eval ( 932’) 
932 

2» int C932’) 
932 





在 这 种 情况 下 ，eval OM int 0 都 返回 相同 的 结果 : 整数 932。 然 而 ， 它 们 采用 的 方式 却 不 尽 相 
同 。 内 建 函 数 eval O 接收 引号 内 的 字符 串 并 把 它 作为 python 表达 式 进 行 求 值 。 内 建 函 数 int (接收 
代表 整数 的 字符 串 并 把 它 转 换 为 整数 。 这 只 有 在 该 字符 串 只 由 字符 串 932 组 成 的 时 候 才 会 成 功 ， 而 
该 字符 串 作 为 表达 式 返 回 值 932, 932 也 是 字符 串 ”932” 所 代表 的 整数 。 当 我 们 用 纯 字 符 串 表达 式 
的 时 候 ， 两 者 便 不 再 相同 了 : 
































> eval( 100 + 200°) 
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300 


>> int( 100 + 200’) Traceback (innermost last): 
File &stdin^/^, line l, in ? 
ValueError: invalid literal for int): 100 + 200 








在 这 种 情况 下 ，eval 0 接收 一 个 字符 串 并 把 “100+200“ 作 为 表达 式 求 值 ， 当 进行 整数 加 法 后 ， 给 
出 返回 值 300。 而 对 intO 的 调用 失败 了 ， 因 为 字符 串 参 数 不 是 能 代表 整数 的 字符 串 ， 因为 在 字符 
串 中 有 非法 的 文字 ， 即 ， 空 格 以 及 “+” 字 符 。 可 以 这 样 理解 eval 0 函数 的 工作 方式 : 对 表达 式 两 端 
的 引号 视而不见 ， 接 着 假设 “如 果 我 是 python 解释 器 ， 我 会 怎样 去 观察 表达 式 呢 ? ”， 换 句 话 说 ， 
如 果 以 交互 方式 输入 相同 的 表达 式 , 解释 器 会 做 出 怎么 样 的 反应 呢 ? 按 下 回 车 后 的 结果 应 该 和 eval 0 
返回 的 结果 相同 。 

















14. 3.4 exec 


和 eval O 相似 ，exec 语句 执行 代码 对 象 或 字符 串 形 式 的 python 代码 。 类 似 地 ， 用 compileO 
预 编译 重复 代码 有 助 于 改善 性 能 , 因为 在 调用 时 不 必 经 过 字 节 编译 处 理 。exec 语句 只 接受 一 个 参数 ， 
下 面 便 是 它 的 通用 语法 : 














exec obj 


被 执行 的 对 象 (obj) 可 以 只 是 原始 的 字符 串 ， 比 如 单一 语句 或 是 语句 组 ， 它 们 也 可 以 预 编 译 成 
一 个 代码 对 象 ( 分 别 用 single’ 和” exec 参数) ,下 面 的 例子 中 , 多 个 语句 作为 一 个 字符 串 发 送 给 exec: 











2 exec "^^^ 
. X=0 
. print °x is currently:’, x 
. While x < 8: 
x t= 1 
print “incrementing x to:', x 
PUY 
x is currently: 0 
incrementing x to: 
incrementing x to: 
incrementing x to: 


incrementing x to: 


MAR & NS — 


incrementing x to: 





最 后 ，exec 还 可 以 接受 有 效 的 python 文件 对 象 。 如 果 我 们 用 上 面 的 多 行 代码 创建 一 个 叫 
xcount. py 的 文件 ， 那 么 也 可 以 用 下 面 的 方法 执行 相同 的 代码 


E 
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>>> f = open( xcount. py’) # open the file 
>>> exec f # execute the file 
x is currently: 0 





incrementing x to: l 

incrementing x to: 2 

incrementing x to: 3 

incrementing x to: 4 

incrementing x to: 5 

>>> exec f # 尝 试 再 一 次 执行 

>>> HR, ROT... 为什么? 


14.3 可 执行 对 象 语 句 和 内 建 函 数 





注意 一 旦 执行 完毕 ， 继 续 对 exec 的 调用 就 会 失败 。 呢 ， 并 不 是 真正 的 失败 。。。 只 是 不 再 做 任何 
事 ， 这 或 许 让 你 感到 吃惊 。 事 实 上 ，exec 已 从 文件 中 读 取 了 全 部 的 数据 且 停 留 在 文件 末尾 (EOF) 。 当 
用 相同 文件 对 象 对 exec 进行 调用 的 时 候 ， 便 没有 可 以 执行 的 代码 了 ， 所 以 exec 什么 都 不 做 ， 如 同 
上 面 看 见 的 行为 。 我 们 如 何 知道 它 在 BOP We? 

















我 们 用 文件 对 象 的 tell 0 方法 来 告诉 我 们 处 于 文件 的 何 处 ， 然 后 用 os. path. getsize () 来 告诉 
我 们 xcount. py 脚本 有 多 大 。 这 样 你 就 会 发 现 ， 两 个 数字 完全 一 样 : 


> f.tellQ # where are we in the file? # FENTFEXLHAIVHAHM ZT? 
116 

2» fclose(Ü # close the file # KIX 

222 from os. path import getsize 

>>> getsize( xcount.py ) # what is the file size? # KTfA BK? 
116 





如 果 想 在 不 关闭 和 重新 打开 文件 的 情况 下 再 次 运行 它 ， 可 以 用 seek 0 到 文件 最 开头 并 再 次 调用 
exec 了。 比如， 假定 我 们 还 没有 调用 f. close ()， 那 么 我 们 可 以 这 样 做 : 





2» f. seek(0) # rewind to beginning fy 会 fF 
222 exec f 

x is currently: 0 
incrementing x to: 
incrementing x to: 


incrementing x to: 


SA UAN 


incrementing x to: 





$— E 
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incrementing x to: 5 
2» £f close 0 





14.3.5 input 





A ÆRA input) 是 evalO 和 raw input O 的 组 合 ， 等 价 于 eval(raw input O) 。 类 似 于 


raw_input 0 ，input 0 有 一 个 可 选 的 参数 ， 该 参数 代表 了 给 用 户 的 字符 串 提示 。 如 果 不 给 定 参数 的 
话 ， 该 字符 串 默 认为 空中。 








从 功能 上 看 , input PEF raw input ()， 因 为 raw_input 0 总 是 以 字符 串 的 形式 ， 逐 字 地 返回 用 
户 的 输入 。input (0 履行 相同 的 的 任务 ; 而且 ， 它 还 把 输入 作为 python 表达 式 进 行 求 值 。 这 意味 着 
input () 返 回 的 数据 是 对 输入 表达 式 求 值 的 结果 : 一 个 python 对 象 。 














下 面 的 例子 会 让 人 更 加 清楚 : 当 用 户 输入 一 个 列表 时 , raw input 0 返回 一 个 列表 的 字符 串 描绘 ， 
而 input 0 返回 实际 的 列表 : 








2» aString = raw input( Enter a list: °) Enter a list: [ 123, ‘xyz’, 4567 J 
222 aString 


"[ 123, “xyz, 45.67 ]^ 
25» type (aString) 
«type 'str'^ 


EMH raw input 0 运行 。 正 如 你 看 见 的 ， 每 样 东 西 都 是 字符 串 。 现 在 来 看 看 当 用 input O 的 时 
候 会 发 生 什么 : 








2» alist = input( Enter a list: ') Enter a list: [ 123, ‘xyz’, 4567 J 
222 alist 

[123, “xyz, 45.67] 

225» type (alist) 

«type list’? 








虽然 用 户 输入 字符 串 ， 但 是 input OJEAR E73 python 对 象 来 求 值 并 返回 表达 式 的 结果 。 
14. 3.6 使 用 Python 在 运行 时 生成 和 执行 Python 代码 


在 这 个 小 节 中 ， 我 们 将 看 到 两 个 python 脚本 的 例子 ， 这 两 个 例子 在 运行 时 刻 把 python 代码 作 
为 字符 串 并 执行 。 第 一 个 例子 更 加 动态 ， 但 第 二 个 突出 了 函数 属性 。 
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在 运行 时 生成 和 执行 Python 代码 





第 一 个 例子 是 loopmake. py 脚本 ， 一 个 简单 的 、 迅 速生 成 和 执行 循环 的 计算 机 辅助 软件 工程 
(CASE) 。 它 提示 用 户 给 出 各 种 参数 (比如 , 循环 类 型 (while 或 for)， 和 迭代 的 数据 类 型 [数字 或 序列 ] )， 
生成 代码 字 串 ， 并 执行 它 





Example 14.1 动态 生成 和 执行 Python 代码 
(loopmake. py) 


1 #!/usr/bin/env python 

2 

3 dashes = '|n' + '— * 50 # dashed line 
4 exec_dict = { 

5 

6 £: °° # for loop 

7 for %s in fs: 


ó print %s 


g “7 
10 

11 's': *** # sequence while loop 
12 fis = 0 


13 %s = “s 

14 while fís « len(%s): 

15 print %s[%s/] 

16 “s = %s + 1 

17 “7 

18 

19 'n': ^** # counting while loop 

20 %s = %d 

21 while fs < fid: 

22 print fs 

28 fis = %s + fid 

24 7 

25 f 

26 

27 def main(): 

28 

29 Itype = raw input( Loop type? (For/While) `°) 
30 dtype = raw input( Data type? (Number/Seq) ') 
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32 if dtype = "m; 
33 start = input( Starting value? ') 





34 stop = input( Ending value (non-inclusive)? ') 
35 step = input (Stepping value? ') 

36 seq = str(range(start, stop, step)) 

37 

38 else: 

39 seq = raw input (Enter sequence: `) 

40 

4l var = raw_input( Iterative variable name? ') 
42 

43 if type == f. 

44 exec str = exec dictí'f' | % (var, seq, var) 
45 

46 elif Itype = °w: 

47 if dtype == £9. 

48 svar = raw input( Enter sequence name? ’) 

49 exec str = exec dictí s ] % | 

50 (var, svar, seq, var, svar, Svar, var, var, var) 
52 elif dtype — 'n': 

53 exec str = exec dictí'n'/ % | 

54 (var, start, var, stop, var, var, var, step) 
55 

56 print dashes 


2 


57 print 'Your custom-generated code:' + dashes 
58 print exec str + dashes 

59 print 'Test execution of the code:' * dashes 
60 exec exec str 

61 print dashes 

62 

63 if name  -- ' main 


64 main() 





以 下 脚本 执行 的 例子 


% loopmake. py 

Loop type? (For/While) f 

Data type? (Number/Sequence) n 
Starting value? 0 

Ending value (non-inclusive)? 4 





$— 一 * 一 
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Stepping value? 1 





Iterative variable name? counter 





The custom-generated code for you is: 





for counter in [0, l1, 2, 3[: 
print counter 





Test execution of the code: 





$5 dR 





% loopmake. py 

Loop type? (For/While) w 

Data type? (Number/Sequence) n 
Starting value? 0 
Ending value (non-inclusive)? 4 
Stepping value? 1 
Iterative variable name? counter 





Your custom-generated code: 





counter = 0 

while counter < 4: 
print counter 
counter = counter + 1 





Test execution of the code: 





U 5 RD 





% loopmake. py 
Loop type? (For/While) f 
Data type? (Number/Sequence) s 





$— E E 
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Enter sequence: [932, 'grail', 3.0, 'arrrghhh' ] 





Iterative variable name? eachItem 





Your custom-generated code: 





for eachItem in [932, 'grail', 3.0, 'arrrghhh' J: 
print eachltem 





Test execution of the code: 





932 
grail 
3.0 
arrrghhh 





% loopmake. py 

Loop type? (For/While) w 

Data type? (Number/Sequence) s 
Enter sequence: [932, ‘grail’, 3.0, ’arrrghhh’ / 
Iterative variable name? eachIndex 
Enter sequence name? myList 





Your custom-generated code: 





eachIndex = 0 

myList = [932, ‘grail’, 3.0, 'arrrghhh' / 
while eachIndex < len(myList): 

print myList[eachIndex] 

eachIndex = eachIndex + 1 





Test execution of the code: 





932 
grail 
3.0 
arrrghhh 





逐 行 解释 
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Lines 1-25 

在 脚本 的 第 一 部 分 ， 我 们 设置 了 两 个 全 局 变量 。 第 一 个 是 由 一 行 破 折 号 〈 即 是 名 字 ) 组 成 的 静 
态 字 符 串 ， 第 三 个 则 是 由 用 于 生成 循环 的 骨架 代码 组 成 的 字典 。for 循环 的 健 值 是 -f ， 用 于 迭代 序 
列 的 while 循环 的 则 是 %“s”“， 而 记 数 while 循环 的 是 nm“ 




















Lines 27 - 30 
这 里 我 们 提示 用 户 输入 他 (她 ) 想 要 的 循环 类 型 和 数据 类 型 





Lines 32-36 

选 定数 字 ; 给 出 开始 , 停止, 以 及 增 量 值 . 在 这 个 部 分 的 代码 中 , 第 一 次 引入 了 内 建 函 数 input O 。 
我 们 将 在 14. 3. 5 小 节 中 看 到 ，input C 和 raw. input O 相似 ， 因 为 它 提 示 用 户 给 出 字符 串 输 入 ， 但 是 
不 同 于 raw_input), input (会 把 输入 当成 python 表达 式 来 求 值 ， 即 使 用 户 以 字符 串 的 形式 输入 ， 
也 会 返回 一 个 python 对 象 








Lines 38 - 39 
选 定 序列 ， 这 里 以 字符 串 的 形式 输入 一 个 序列 





Line 41 
给 出 用 户 想 要 使 用 的 迭代 循环 变量 的 名 字 


: Lines 43 - 44 : 
生成 添加 自 定义 内 容 的 for 循环 。 


Lines 46 - 50 
生成 迭代 序列 的 while 循环 。 








Lines 52-54 
生成 计数 的 while 循环 


Lines 56 -61 
输出 生成 的 源 代 码 及 其 执行 后 的 结果 





Lines 63 - 64 
当 直 接 调 用 该 模块 的 时 候 ， 执 行 main () 








为 了 很 好 地 控制 脚本 的 大 小 ,我们 从 原来 的 脚本 中 崭 除 了 所 有 的 注释 和 错误 检测 。 在 本 书 的 web 
站 点 上 , 都 可 以 找到 原来 的 和 修改 后 的 版 本 。 














扩展 的 版 本 包括 了 额外 的 特性 ， 比 如 用 于 字符 串 输入 的 不 必要 的 引号 ， 输 入 数据 的 默认 值 ， 以 
及 检测 无 效 的 返回 和 标识 符 ; 也 不 允许 以 关键 字 和 内 建 名 字 作为 变量 名 字 
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有 条 件 地 执行 代码 








第 二 个 例子 着 重 描写 了 在 第 11 章 “ 函 数 “ 引 入 的 函数 属性 , 它 是 从 Python 增强 提议 232(PEP 232) 
中 的 例子 得 到 的 灵感 。 假 设 你 是 一 位 负责 质量 控制 的 软件 开发 者 ， 你 鼓励 你 的 工程 师 将 回归 测试 或 
回归 指令 代码 放 到 主 代 码 中 ， 但 又 不 想 让 测试 代码 混合 到 产品 代码 中 。 你 可 以 让 工程 师 创 建 字符 串 
形式 的 测试 代码 。 当 你 的 测试 框架 执行 的 时 候 ， 它 会 检测 函数 是 否定 义 了 测试 体 ， 如 果 是 的 话 ，( 求 
值 并 ) 执行 它 。 如 果 不 是 ， 便 跳 过 ， 像 通常 一 样 执行 





























o 


Example 14.2 Function Attributes (funcAttrs. py) 


调用 sys. exit O 使 python 解释 器 退出 。exit O 的 任何 整数 参数 作为 退出 状态 会 返回 给 调用 者 ， 
该 值 默认 为 0 





7 #!/usr/bin/env python 
2 
3 def foo: 
4 return True 
5 
6 def bar: 
7 'bar( does not do much’ 
ó return True 


9 

10 foo. doc = 'foo() does not do much’ 
11 foo. tester = ''' 

12 if foo: 

13 print ° PASSED’ 

14 else: 

15 print ’ FAILED’ 

ig? 

17 


18 for eachAttr in dir: 

19 obj = eval (eachAttr) 

20 if isinstance(obj, type(foo)): 

21 if hasattr(obj, ° doe °): 

22 print '|nFunction “%s” has a doc 

string: \n\t%s’ % (eachAttr, obj. doc ) 

23 if hasattr(obj, 'tester'): 

24 print 'Function “%s” has a tester... executing % eachAttr 


25 exec obj. tester 





$— 一 * 一 
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26 else: 
27 print 'Function "s^ has no tester... skipping % eachAttr 
28 else: 


29 print '^"Ás^ is not a function’ % eachAttr 


Lines 1-8 
我 们 在 脚本 的 开始 部 分 定义 了 foo 0 和 bar (0) 。 两 个 函数 都 只 是 返回 True。 不 同 点 在 于 fooO 1€ 
有 属性 而 bar 0) 有 文档 字 串 。 








Lines 10-16 
使 用 函数 属性 ， 我 们 给 foo() 加 入 了 文档 字 串 以 及 退化 或 单元 测试 字符 串 。 注 意 检测 字符 串 实际 
上 由 python 代码 组 成 。 














Lines 18 - 29 

好 了 ， 真 正 的 工作 在 这 里 开始 。 我 们 从 用 内 建 函 数 dir 0 迭代 现在 ( 即 全 局 ) ASR. € 
返回 的 列表 包含 了 所 有 对 象 的 名 字 。 因 为 这 些 都 是 字符 串 ， 我 们 需要 在 第 19 行将 它们 转化 为 真正 的 
python 对 象 。 

















除了 预期 的 系统 变量 ， 比 如 ， ”builtins”， 我 们 还 期 望 显示 函数 。 我 们 只 对 函数 有 兴趣 ， 第 
20 行 的 代码 让 我 们 跳 过 了 所 有 过 到 的 非 函 数 对 象 。 一 旦 我 们 知道 我 们 有 某 个 函数 ， 就 可 以 检查 它 是 
否 有 文档 字 串 ， 如 果 有 的 话 ， 把 它 显 示 出 来 。23-27 行 表 演 了 魔法 。 如 果 函 数 有 检测 属性 ， 那 么 就 
执行 它 ， 否 则 告诉 用 户 没有 可 用 的 单元 测试 。 最 后 的 几 行 显示 出 遇 到 的 非 函数 对 象 的 名 字 。 执 行 代 
码 后 ， 我 们 得 到 如 下 的 输出 : 






































$ python funcAttr. py 


^ 


^ builtins “ is not a function 


^ ^ 


doc ^ is not a function 


^ file ^ is not a function 


” name “ is not a function 


Function “bar” has a doc string: 
bar() does not do much 
Function “bar” has no tester... skipping 


Function “foo” has a doc string: 
foo() does not do much 


Function “foo” has a tester... executing 
PASSED 
[e— —e— 
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当 讨 论 执 行 其 他 程序 时 ， 我 们 把 它们 分 类 为 python 程序 和 其 他 所 有 的 非 python 程序 ， 后 者 包 
括 了 二 进 制 可 执行 文件 或 其 他 脚本 语言 的 源 代码 。 我 们 先 讨论 如 何 运行 其 他 的 python 程序 ， 然 后 是 
如 何 用 os 模块 调用 外 部 程序 。 





14. 4 执行 其 他 (Python) 程序 








14.4.1 导入 











在 运行 时 刻 ， 有 很 多 执行 另外 python 脚本 的 方法 。 正 如 我 们 先前 讨论 的 ， 第 一 次 导入 模块 会 执 
行 模块 最 高 级 的 代码 。 不 管 你 是 否 需要 ， 这 就 是 python 导入 的 行为 。 提 醒 ， 只 有 属于 模块 最 高 级 的 
代码 才 是 全 局 变量 ， 全 局 类 ， 和 全 局 函数 声明 。 
































BOZ: GRGA, IIATBFEIUMA 
ORE- -PERME EME 3 ZMA 12 BEB KAT, WERN MI 249A python 
BUS, MAITIAK GFA python HIF, ARITZEA SHE foo BRIR, CEF 
FERBER VHR) python f, Het, "main Q^. A58 foo EH bar BRA, 
AULA ET def fool...) o BEBI ACIE A Ze BUBHIUBE T nnn Hr FACIEI, bar LABIA foo 
e BUE M NEUE, IDEE bar 在 foo lU FEIN, JUI, AFEEUEATEEEUE — NEL E 








AYRE, BERRIRA P HIEI -VR MERIAL EOLA ST» ABA TREERNE 
SA AIATIBITOPEIE? Apul. HIKA if name ==’ main ' PAIRE 

















跟着 应 该 是 一 个 if 语句 ， 它 通过 检测 _name 来 确定 是 否 要 调用 脚本 ， 比 如 ,“if name == 
' main “” 如 果 相 等 的 话 ， 你 的 脚本 会 执行 main 内 代码 ;否则 只 是 打算 导入 这 个 脚本 ， 那 么 可 
以 在 这 个 模块 内 对 代码 进行 测试 。 














当 导 入 python 模块 后 ， 会 执行 该 模块 ! 当 你 导入 foo 模块 时 候 ， 它 运行 所 有 最 高 级 别 的 〈 即 没 
有 缩 进 的 ) python 4845, eee FRI IRA A SHE? veer 由 于 某 些 原因 ，bar 必须 被 识别 
为 foo 模块 中 一 个 有 效 的 名 字 ， 也 就 是 说 bar 在 foo 的 名 字 空 间 中 ， 其 次 ， 解 释 器 要 知道 它 是 一 个 
已 声明 的 函数 ， 就 像 本 地 模块 中 的 任何 一 个 函数 。 现 在 我 们 知道 要 做 什么 了 ， 那 么 如 何 处 理 那 些 不 
想 每 次 导入 都 执行 的 代码 昵 ? MEE, FA if name ==’ main ”的 内 部 。 


























# importl.py 
print 'loaded importl' 
import import2 


这 里 是 import2. py HAR: 


# import2. py 
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print 'loaded import2’ 





这 是 当 我 们 导入 importl 时 的 输出 


225 import importi loaded importi loaded importZ 
ps 





根据 建议 检测 _name_ 值 的 迁 回 工作 法 ， 我 们 改变 了 importl.py 和 import2.py 里 的 代码 ， 这 
样 的 情况 就 不 会 发 生 了 





这 里 是 修改 后 的 import. py 版 本 : 


# importl.py 
import import2 


if name  -- ' main 





print 'loaded importl' 


接着 是 import2. py 的 代码 ， 以 相同 的 方式 修改 : 


# import2. py 
if name ==’ main ’ 
print 'loaded import2’ 


“4M python 中 导入 import] 的 时 候 ， 我 们 不 再 会 得 到 任何 输出 





222 import importi 
222 











这 不 意味 着 在 任何 的 情况 下 ， 都 该 这 样 编写 代码 。 在 某 些 情况 中 ， 你 可 能 想 要 显示 输出 来 确定 
输入 模块 。 这 取决 于 你 自身 的 情况 。 我 们 的 目标 是 提供 实效 的 编程 例子 来 屏 胡 副作用 




















14.4.2 execfile() 





显然 ， 叶 入 模块 不 是 从 男 外 的 python 脚本 中 执行 python 脚本 最 可 取 的 方法 。 那 也 就 不 是 导入 
过 程 。 导 入 模块 的 副作用 是 导致 最 高 级 代码 运行 。 





这 章 一 开始 , 我 们 描述 了 如 何 通过 文件 对 象 , 使 用 exec 语句 来 读 取 python 脚本 的 内 容 并 执行 。 
下 面 的 代码 给 出 了 例子 : 
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f - open(filename, 'r') 
exec f f. close() 





ix 3 行 可 以 调用 execfile (来 换 掉 : 





execfile(filename) 





虽然 上 述 代 码 执行 了 一 个 模块 ， 但 是 仅 可 以 在 现 有 的 执行 环境 下 运行 〈 比 如 ， 它 自己 的 全 局 和 
局 部 的 名 字 空 间 )。 在 某 些 情况 下 ， 可 能 需要 用 不 同 全 局 和 局 部 的 名 字 空 间 集 合 ， 而 不 是 默认 的 集合 
来 执行 模块 。execfile() 函数 的 语法 非常 类 似 于 eval 0 〇 函数 的 。 














execfile(filename, globals=globals(), locals-locals ()) 





类 似 eval () globals 和 locals 都 是 可 选 的 ， 如 果 不 提供 参数 值 的 话 ， 默 认为 执行 环境 的 名 字 
空间 。 如 果 只 给 定 globals, MA locals 默认 和 globals 相同 。 如 果 提 供 locals 值 的 话 ， 它 可 以 是 
任何 映射 对 象 [一 个 定义 / 履 盖 了 _getitem (的 对 象 ] 。 在 在 2.4 Zi, locals 必须 是 一 个 字典 。 
TER: (在 修改 的 时 候 ) 小 心 局 部 名 字 空 间 。 比 较 安 全 的 做 法 是 传 入 一 个 虚假 的 locals” 字 — 典 并 检查 
Ze T8 BER. execfile 0 〇 不 保证 不 会 修改 局 部 名 字 空 间 。 见 python 库 参 考 手 册 对 execfile (的 解 


RE 


$ 14.4.3 将 模块 作为 脚本 执行 


python2.4 里 加 入 了 一 个 新 的 命令 行 选项 (或 开关 )， 人 允许 从 shell 或 DOS 提示 符 ， 直 接 把 模块 
作为 脚本 来 执行 。 当 以 脚本 的 方式 来 书写 你 的 模块 的 时 候 ， 执 行 它们 是 很 容易 的 。 你 可 以 使 用 命令 
行 从 你 的 工作 目录 调用 你 的 脚本 。 



































$ myScript. py # or $ python myScript. py 











如 果 模 块 是 标准 库 的 一 部 分 ， 安 装 在 site-packages 里 ， 或 者 仅仅 是 包 里 面 的 模块 ， 处 理 这 样 
的 模块 就 不 是 那么 容易 了 ， 尤 其 是 它们 共享 了 已 存在 的 同名 python 模块 。 举 例 来 说 ， 你 想 运 行 免费 
的 python web 服务 器 ， 以 便 创建 和 测试 你 自己 的 web 页 面 和 CGI 脚本 。 




















你 将 必须 在 命令 行 衷 入 如 下 的 东西 : 


$ python /usr/local/lib/python2x/CGIHTTPServer. py 
Serving HTTP on 0.0.0.0 port 8000... 


这 是 段 很 长 的 命令 ， 如 果 它 是 第 三 方 的 ， 你 不 得 不 深入 到 site-packages 去 找到 它 真 正定 位 的 
地 方 。 如 果 没 给 出 完全 的 路 径 名 ， 可 以 从 命令 行 运行 一 个 模块 ， 并 让 python 的 导入 机 制 为 我 们 做 这 
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种 跑腿 工作 吗 ? 答案 是 肯定 的 。 我 们 可 以 用 python -c 命令 行 开关 : 


$ python -c “import CGIHTIPServer; CGIHTTPServer. test 





该 选项 允许 你 指定 你 想 要 运行 的 python 语句。 虽然 它 可 以 这 样 工作 ， 但 问题 是 _name “模块 不 








ie ‘main ”........ 而 是 你 正在 使 用 的 模块 。( 需 要 的 话 ， 你 可 以 参阅 前 面 的 3.4 1 小 节 复 习 
. name _) 在 最 后 一 行 ， 解 释 器 通过 import 装载 了 你 的 模块 ， 并 不 是 它 当 作 肢 本。 因为 如 此 ， 所 有 
在 if name ==’ main ”之 下 的 代码 是 不 会 执行 的 ， 所 以 你 不 得 不 手动 地 调用 模块 的 test O 








函数 ， 就 如 同 前 面 我 们 所 做 的 一 样 。 所 以 我 们 想 同时 要 两 者 的 优点 一 一 能 够 在 类 库 中 执行 作为 脚本 
的 模块 而 不 是 作为 导入 的 模块 。 这 就 是 -mn 参数 的 动机 。 现 在 可 以 像 这 样 运行 脚本 : 


$ python -m CGIHTTPServer 


这 是 不 小 的 改进 。 尽 管 如 此 ， 还 没有 完全 如 预想 那样 实现 特性 。 所 以 在 python2. 5 F, -m 开关 
有 了 更 多 的 兼容 性 。 从 2. 5 开始 ， 你 可 以 用 相同 的 参数 来 运行 包 内 或 需要 特别 加 载 的 模块 ， 比 如 zip 
文件 里 的 模块 ， 这 是 在 2.3 加 入 的 特性 (12.5.7 小 节 ，396 页 )。python2. 4 只 让 你 执行 标准 的 库 模 
块 。 所 以 初始 版 本 的 -m 选项 是 不 能 运行 特殊 的 模块 如 PyCHecker(python 的 lint)， 或 其 他 的 
profiler (注意 这 些 是 装载 和 运行 其 他 模块 的 模块 )。 但 是 2. 5 版 本 解决 了 这 个 问题 。 


$ 14. 5 执行 其 他 〈 非 Python) 程序 E 


在 python 程序 里 我 们 也 可 以 执行 非 python 程序 。 这 些 程序 包括 了 二 进 制 可 执行 文件 ， 其 他 的 
shell 脚本 等 等 。 所 有 的 要 求 只 是 一 个 有 效 的 执行 环境 ， 比 如 ， 允 许 文 件 访问 和 执行 ， 脚本 文件 必须 
能 访问 它们 的 解释 器 (perl，bash, 等 等 )， 二 进 制 必须 是 可 访问 的 《和 本 地 机 器 的 构架 碌 容 ) 












































最 终 ， 程 序 员 必 须 考虑 python 脚本 是 否 必须 和 其 他 将 要 执行 的 程序 通信 。 有 些 程序 需要 输入 ， 
而 有 的 程序 返回 得 出 以 及 执行 完成 时 的 错误 代码 ， 也 许 有 的 两 者 都 做 。 针 对 不 同 的 环境 ，python 提 
供 了 各 种 执行 非 python 程序 的 方法 ,在 本 节 讨论 的 所 有 函数 都 可 以 在 os 模块 中 找到 。 在 表 14. 6 中 ， 
我 们 做 了 总 结 《〈 我 们 会 对 那些 只 适合 特定 平台 的 函数 进行 标注 )， 作 为 对 本 世 剩余 部 分 的 介绍 。 























Table 14.6 执行 外 部 程序 的 os 模块 函数 
(u 只 对 unix 有 效 ， w 只 对 windows 有 效 ) 

















os 模块 函数 描述 

system (cmd) 执行 程序 cmd《〈 字 符 串 )， 等 待 程序 结束 ， 返 回 退 出 代码 (windows F, 
始终 为 0) 

fork () 创建 一 个 和 父 进 程 并 行 的 子 进程 [通常 来 说 和 exec O0 一 起 使 用 ] ; 返回 两 
次 .… .一 次 给 父 进 程 一 次 给 子 进程 


execl(file, arg0,argl,...) 用 参数 列表 arg0, argi 等 等 执行 文件 
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execv (file, arglist) ”除了 使 用 参数 向 量 列表 ， 其 他 的 和 exec1() 相同 

execle(file, arg0,argl,... env) 和 execl 相同 ， 但 提供 了 环境 变量 字典 env 

execve(file,arglist, env) 除了 这 有 参数 向 量 列 表 ， 其 他 的 和 execle O THER] 

execlp (cmd，arg0, argl,...) 于 execl(O 相 同 ， 但 是 在 用 户 的 搜索 路 径 下 搜索 完全 的 文件 路 径 
名 

execvp(emd, arglist) 除了 带 有 参数 向 量 列表 ， 与 execlp () 相同 

















Table 14.6 执行 外 部 程序 的 os 模块 函数 〈 续 表 ) (u 只 对 unix AR, w 只 对 windows AXO 





os 模块 函数 描述 

execlpe (cmd, arg0, argl,... env) 和 execlp 相同 ， 但 提供 了 环境 变量 字典 env 

execvpe (cmd, arglist, env) 和 execvp 相同 ， 但 提供 了 环境 变量 字典 env 

spawn*' (mode, file, args[, env]) spawn () 家 族 在 一 个 新 的 进程 中 执行 路 径 ，args 作为 
参数 ， 也 许 还 有 环境 变量 的 字典 env; fast (mode) 是 
个 显示 不 同 操作 模式 的 魔术 。 
































wait() 等 待 子 进 程 完成 [通常 和 fock 和 exec O 一 起 使 用 ] O 
waitpid(pid, options) 等 待 指定 的 子 进程 完成 [通常 和 fock 和 exec () 一 起 使 用 ] O 
popen (cmd, mode=’ r’ , buffering--1) 执行 字符 串 cmd， 返 回 一 个 类 文件 对 象 作 为 运行 程 


序 通信 句柄， 默认 为 读 取 模式 和 默认 系统 缓冲 


startfile’ (path) 用 关联 的 应 用 程序 执行 路 径 W 
a. spawn*( Pi AAT 44 Ej exec*() 相似 《两 个 家 族 都 有 8 个 成 员 ); spawnv O 和 spawnve (在 


python 1.5.2 加 入 ,其 他 的 六 个 spawn*() 函数 在 python 1.6 加 入 ; spawnlpO, spawnlpe()， 
spawnvp() 和 spawnvpe () 只 适用 于 unix 平台。 
b.  python2. 0 是 加 入 的 





随 着 越 来 越 接 近 软 件 的 操作 系统 层面 ， 你 就 会 发 现 执 行 跨 平台 程序 (甚至 是 python 脚本 ) 的 一 
致 性 开始 有 些 不 确定 了 。 上 面 我 们 提 到 在 这 个 小 节 中 描述 的 程序 在 os 模块 中 。 事 实 上 ， 有 多 个 os 
模块 。 比 如 说 ， 基 于 Unix 衍生 系统 (例如 Linux, MacOS X, Solaris, BSD 等 等 ) 的 模块 是 posix 模 
ER, windows 的 是 nt (无 论 你 现在 用 的 是 哪个 版 本 的 windows;dos 用 户 有 dos 模块 )， 旧 的 macos 为 
mac 模块 。 不 用 担心 ， 当 你 调用 import os 的 时 候 ，python 会 装载 正确 的 模块 。 你 不 需要 直接 导入 
特定 的 操作 系统 模块 。 












































在 我 们 看 看 每 个 模块 函数 之 前 ， 对 于 python2. 4 或 者 更 新 版 本 的 用 户 ， 这 里 有 个 subprocess 模 
块 ， 可 以 作为 上 面 所 有 函数 很 好 的 蔡 代 品 。 我 们 本 章 稍 后 部 分 演示 如 何 使 用 这 些 函 数 ， 然 后 在 最 后 
给 出 subprocess. Popen 类 和 subprocess. call O 函数 的 等 价 使 用 方法 。 











14.5.1 os.system() 
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我 们 列表 中 的 第 一 个 函数 是 system() ， 一 个 非常 简单 的 函数 ， 接 收 字符 串 形 式 的 系统 命令 并 执 
行 它 。 当 执行 命令 的 时 候 ，python 的 运行 是 挂 起 的 。 当 我 们 的 执行 完成 之 后 ， 将 会 以 system) 的 返 
回 值 形式 给 出 退出 状态 ，python 的 执行 也 会 继续 。 





system) 保留 了 现 有 的 标准 文件 ， 包 括 标准 的 输出 ， 意 味 着 执行 任何 的 命令 和 程序 显示 输出 都 
会 传 到 标准 输出 上 。 这 里 要 当心 ， 因 为 特定 应 用 程序 比如 公共 网 关 接 口 (C61) ， 如 果 将 除了 有 效 的 超 
文本 标示 语言 HTML) 字符 串 之 外 的 输出 ， 经 过 标准 输出 发 送 回 客户 端 ， 会 引起 web 浏览 器 错误 。 
system Q 通常 和 不 会 产生 输出 的 命令 一 起 使 用 ， 其 中 的 一 些 命令 包 括 了 压缩 或 转换 文件 的 程序 ， 挂 
载 磁盘 到 系统 的 程序 ， 或 其 他 执行 特定 任务 的 命令 一 -通过 退出 状态 显示 成 功 或 失败 而 不 是 通过 输入 
和 /或 输出 通信 。 通 常 的 约定 是 利用 退出 状态 ，0 表示 成 功 ， 非 零 表 示 其 他 类 型 的 错误 。 




















为 了 给 出 一 个 例子 ， 我 们 执行 了 两 个 从 交互 解释 器 中 获取 程序 输入 的 命令 ， 这 样 你 便 可 以 观察 
system © 是 如 何 工 作 的 


222 import os 
22^ result = os. system( cat /etc/motd’) Have a lot of fun... 
22^ result 

0 

22^ result = os. system( uname -a') 

Linux solo 2.2.13 #1 Mon Nov 8 15:08:22 CET 1999 1586 unknown 
222^ result 

0 


可 以 看 到 两 个 命令 的 输出 和 它们 执行 的 退出 状态 ， 我 们 将 其 保存 到 result 变量 中 。 下 面 是 一 个 
执行 dos 命令 的 例子 : 


>>> import os 
>>> result = os.system('dir') 


Volume in drive C has no label 
Volume Serial Number is 43D1-6C8A 
Directory of C:\WINDOWS\TEMP 


<DIR> 01-08-98 8:39a . 
<DIR> 01-08-98 8:39a . 
0 file(s) 0 bytes 
2 dir(s) 572,588,032 bytes free 
>>> result 
0 


14.5.2 os. popen() 
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popen O 函数 是 文件 对 象 和 system O 函数 的 结合 。 它 工作 方式 和 system O 相同 ， 但 它 可 以 建立 
一 个 指向 那个 程序 的 单 向 连接 ， 然 后 如 访问 文件 一 样 访问 这 个 程序 。 如 果 程 序 要 求 输入 ， 那 么 你 要 
FA w 模式 写 入 那个 命令 来 调用 popen () 。 你 发 送 给 程序 的 数据 会 通过 标准 输入 接收 到 。 同 样 地 ，"T 
模式 允许 spawn 命令 ， 那 么 当 它 写 入 标准 输出 的 时 候 ， 你 就 可 以 通过 类 文件 句柄 使 用 熟悉 的 file 对 
象 的 read () 方 法 来 读 取 输 入 。 就 像 对 于 文件 ， 当 使 用 完毕 以 后 ， 你 应 当 closeO 连 接 。 在 上 面 其 中 
一 个 使 用 system) 的 例子 中 , 我 们 调用 了 unix 程序 uname 来 来 给 我 们 提供 机 器 和 使 用 的 操作 系统 的 
相关 信息 。 该 命令 产生 了 一 行 输出 ， 并 直接 写 到 屏幕 上 。。 如 果 想 要 把 该 字符 串 读 入 变量 中 并 执行 内 
部 操作 或 者 把 它 存储 到 日 志文 件 中 ， 我 们 可 以 使 用 popen () 。 实 际 上 ， 代 码 如 下 所 示 : 





























222 import os 

25» f = os. popen( uname -a') 

2 data = f. readline Q) 

D>» f. close?) 

225^ print data, 

Linux solo 2. 2. 13 #1 Mon Nov 8 15:08:22 CET 1999 1586 unknown 


如 你 所 见 ，popen O 返回 一 个 类 文件 对 象 ; 注意 readline O, 往往 , 保留 输入 文本 行 尾 的 newline 
字符 。 


. 14.5.3 os.fork(), os. exec*(), os. wait*() $ 


在 这 个 小 节 中 , 我 们 不 会 对 操作 系统 理论 做 详尽 的 介绍 ， 只 是 稍稍 地 介绍 一 下 进程 process). 
fork (采用 称 为 进程 的 单一 执行 流程 控制 ， 如 果 你 喜欢 的 话 ， 可 称 之 为 创建 “岔路 口 ?。 有 趣 的 事情 
发 生 了 : 用 户 系统 同时 接管 了 两 个 fork 一 一 也 就 是 说 让 用 户 拥有 了 两 个 连续 且 并 行 的 程序 。( 不 用 说 ， 
它们 运行 的 是 同一 个 程序 ， 因 为 两 个 进程 都 是 紧 跟 在 fork O 调用 后 的 下 一 行 代码 开始 执行 的 )。 调 用 
fork 0 的 原始 进程 称 为 父 进程 ， 而 作为 该 调用 结果 新 创建 的 进程 则 称 为 子 进程 。 当 子 进程 返回 的 时 
候 , 其 返回 值 永远 是 0; 当 父 进程 返回 时 , 其 返回 值 永远 是 子 进程 的 进程 标识 符 (又 称 进 程 ID, BK PID) 
(这样 父 进 程 就 可 以 监控 所 有 的 子 进程 了 ) PID 也 是 唯一 可 以 区 分 他 们 的 方式 ! 我 们 提 到 了 两 个 进程 
会 在 调用 fork Q 后 立刻 运行 。 因 为 代码 是 相同 的 ， 如 果 没 有 其 他 的 动作 ， 我 们 将 会 看 到 同样 的 执行 
结果 。 而 这 通常 不 是 我 们 想 要 的 结果 。 创 建 男 外 一 个 进程 的 主要 目的 是 为 了 运行 其 他 程序 ， 所 以 我 
们 必须 在 父 进程 和 子 进程 返回 时 采取 分 流 措 施 。 正 如 上 面 我 们 所 说 ， 它 们 的 PID 是 不 同 的 ， 而 这 正 
是 我 们 区 分 它们 的 方法 。 






























































对 于 那些 有 进程 管理 经 验 的 人 来 说 ， 接 下 来 的 这 段 代 码 是 再 熟悉 不 过 了 。 但 是 ， 如 果 你 是 新 手 
的 话 , 一 开始 就 弄 懂 它 是 如 何 工作 的 可 能 就 有 点 困难 了 , 但 是 一 旦 你 懂 了 ， 就 会 体会 到 其 中 的 奥妙 。 























ret = os. fork() # spawn 2 processes, both return #8°” 和 BF AK el] 
if ret == 0:  # child returns with PID of 0 Y ULFEXS EIN PID Æ 0 
child suite # child code VY ULFEIHTURE 
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else:  # parent returns with child's PID EXAFEKREE FH FEN PID 
parent suite # parent code WÁÍCULFEIRgf C44 














在 代码 第 一 行 便 调用 了 fork O 。 现 在 子 进程 和 父 进程 同时 在 运行 。 子 进程 本 身 有 虚拟 内 存 地 址 
空间 的 拷贝 ， 以 及 一 份 父 进程 地 址 空间 的 原样 拷贝 。- 一 一 是 的 ， 两 者 几乎 都 是 相同 的 。fork 0 ik El 
两 次 ， 意 味 着 父 进程 和 子 进 程 都 返回 了 。 你 或 许 会 问 ， 如 果 它 们 两 个 同时 返回 ， 如 何 区 分 两 者 呢 ? 








当 父 杀人 返回 的 时 候 ， 会 带 有 进程 的 PID。 而 当 子 进程 返回 的 时 候 ， 其 返回 值 为 0。 这 就 是 区 分 两 个 进 
程 的 方法 。 





利用 if-else 语句 ， 我 们 能 给 子 进程 (比如 ，if 子 句 ) 和 父 进程 (else 子 句 ) 指定 各 自 的 执行 
代码 。 在 子 进程 的 代码 中 ， 我 们 可 以 调用 任何 exec O 函数 来 运行 完全 不 同 的 程序 ， 或 者 同一 个 程序 
中 的 其 他 的 函数 〈 只 要 子 进程 和 父 进 程 用 不 同 的 路 径 执行 )。 普 遍 做 法 是 让 子 进程 做 所 有 的 脏 活 ， 而 
父 进程 耐心 等 来 子 进程 完成 任务 ， 或 继续 执行 ， 稍 后 再 来 检查 子 进程 是 否 正 常 结束 。 





























所 有 的 exec O 函数 装载 文件 或 者 命令 ， 并 用 参数 列表 (分别 给 出 或 作为 参数 列表 的 一 部 分 ) 来 
执行 它 。 如 果 适 用 的 话 ， 也 可 以 给 命令 提供 环境 变量 字典 。 这 些 变 量 普遍 用 于 给 程序 提供 对 当前 执 
行 环 境 的 精确 描述 。 其 中 一 些 著名 的 变量 包括 用 户 的 名 字 ， 搜 索 路 径 ， 现 在 的 shell， 终 端 类 型 ， 本 
地 化 语言 ， 机 器 类 型 ， 操 作 系统 名 字 等 等 。 







































































器 。 和 system (不 一 样 ， 对 于 Python 来 说 没有 返回 值 〈 因 为 Python 已 经 被 蔡 代 了 )。 如 果 因 为 某 
种 原因 ， 程 序 不 能 执行 ， 那 么 execk () 就 会 失败 ， 进 而 导致 引发 异常 。 





所 有 版 本 的 exec () 都 会 用 给 定 文件 作为 现在 要 执行 的 程序 取代 当前 ( 子 ) 进程 的 Python 解释 E 





接 下 来 的 代码 在 子 进程 中 开始 了 一 个 称 为 “xbil1” 的 可 爱 小 巧 的 游戏 , 而 父 进程 继续 运行 Python 
解释 器 。 因 为 子 进程 从 不 返回 ， 所 以 无 需 去 顾虑 调用 exec () 后 的 子 进程 代码 。 注 意 该 命令 也 是 参数 
列表 中 的 必须 的 第 一 个 参数 。 





ret = os. fork O 

if ret = 0: # child code #FG4FERF 

execvp( xbill', ['xbill']) 

else: # parent code KI UÉEÍUMA os. wait 





在 这 段 代 码 中 ， 还 可 以 看 到 对 wait O 的 调用 。 当 子 进程 执行 完毕 ， 需 要 它们 的 父 进 程 进行 扫 
尾 工 作 。 这 个 任务 ， 称 为 ” 收获 孩子 ” (reaping a child), HUH wati*() 函数 完成 。 紧 跟 在 fork O 
之 后 ， 父 进程 可 以 等 待 子 进程 完成 并 在 那 进行 扫尾 。 父 进程 也 可 以 继续 运行 ， 稍 后 再 扫尾 ， 同 样 也 
是 用 wait* () 函数 中 的 一 个 。 








4 


不 管 父 进程 选择 了 那个 方法 ， 该 工作 都 必须 进行 。 当 子 进 程 完成 执行 ， 还 没有 被 收获 的 时 候 ， 
它 进 入 了 闲置 状态 ， 变 成 了 著名 的 僵尸 进程 。 在 系统 中 ， 应 该 尽量 把 僵尸 进程 的 数目 降 到 最 少 ， 因 
为 在 这 种 状态 下 的 子 进 程 仍 保留 着 在 存活 时 期 分 配给 它们 的 系统 资源 ， 而 这 些 资源 只 能 在 父 进程 收 
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获 它们 之 后 才能 释放 掉 。 





调用 wait O 会 挂 起 执行 (比如 ，waits)， 直 到 子 进程 (其 他 的 子 进程 正常 执行 完毕 或 通过 
信号 终止 。wait 0 将 会 收获 子 进程 ， 释 放 所 有 的 资源 。 如 果子 进程 已 经 完成 ， 那 么 wait 0 只 是 进行 
些 收 获 的 过 程 。waitpid() 具有 和 wait O 相同 的 的 功能 ， 但 是 多 了 一 个 参数 PID 指定 要 等 待 子 进 
程 的 进程 标识 符 )， 以 及 选项 (通常 是 零 或 用 “0R” 组 成 的 可 选 标 志 集 合 ) 














14.5.4 os. spawn*() 





函数 spawn* () 家 族 和 fork, exec* O 相似 ， 因 为 它们 在 新 进程 中 执行 命令 ， 然 而 ， 你 不 需要 分 
别 调 用 两 个 函数 来 创建 进程 ， 并 让 这 个 进程 执行 命令 。 你 只 需 调 用 一 次 spawn () 家族 。 由 于 其 简单 
性 ， 你 放弃 了 “跟踪 ” 父 进 程 和 子 进程 执行 的 能 力 ; 该 模型 类 似 于 在 线程 中 启动 函数 。 还 有 点 不 同 
的 是 你 必须 知道 传 入 spawn*() 的 魔法 模式 参数 。 在 其 他 的 操作 系统 中 (尤其 是 蔡 入 式 实时 操作 系统 
[RTOS] ), spawn* () EG fork ) 快 很 多 。 不 是 这 种 情况 的 操作 系统 通常 使 用 写实 撕 风 (copy-on-write) 
技术 。 参 阅 python 库 参 考 手 册 来 获得 更 多 spanw*() 的 资料 。 各 种 spanw*() 家 族 成 员 是 在 1.5 和 1.6 
(41.6) 之 间 加 入 的 。 




















14.5.5 subprocess 模块 


在 python2.3 出 来 之 后 ， 一 些 关 于 popend 模块 的 工作 开始 展开 。 一 开始 该 命名 继承 了 先前 E 
popen* () 函数 的 传统 ,但 是 并 没有 延续 下 来 , 该 模块 最 终 被 命名 为 subproess, 其 中 一 个 类 叫 Popen， 

集中 了 我 们 在 这 章 讨 论 的 大 部 分 面向 进程 的 函数 。 同 样 也 有 名 为 call () 的 便捷 函数 ， 可 以 轻易 地 取 

AR T os. system() 。 在 python2.4 HH, subprocess 初次 登场 。 下 面 就 是 演示 该 模块 的 例子 : 














t os. system() 
Linux 上 的 例子 : 


>>> from subprocess import call 


222 import os 

22^ res = call(( cat’, '/etc/motd')) 

Linux starship 2. 4. 18-1-686 #4 Sat Nov 29 10:18:26 EST 2003 1686 
GNU/Linux 

222 res 

0 
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Win32 例子 





>>> res = call(('dir', r'c:\windows\temp'), shell=True) 
Volume in drive C has no label. 
Volume Serial Number is F4C9-1C38 


Directory of c: \windows\temp 
03/11/2006 02:08 AM «DIR- 


03/11/2006 02:08 AM <DIR> us 
02/21/2006 08:45 PM 851 install.log 


02/21/2006 07:02 PM 444 tmp.txt 
2 File(s) 1,295 bytes 


3 Dir(s) 55,001,104,384 bytes free 


取代 os. popen () 
创建 Popen O 实例 的 语法 只 比 调用 os. popen O 函数 复杂 了 一 点 


>>> from subprocess import Popen, PIPE 

>>> f = Popen(( uname’, '-a'), stdout=PIPE). stdout 
>>> data = f. readline () 

>>> f.closeQ 

>>> print data, 

Linux starship 2. 4. 18-1-686 #4 Sat Nov 29 10:18:26 EST 2003 1686 
GNU/Linux 

>>> f = Popen( who’, stdout=PIPE). stdout 

>>> data = [ eachLine.stripO for eachLine in f ] 
>>> f. close Q 

>>> for eachLine in data: 


print eachLine 


wesc console Mar 11 12:44 


wesc ttypl Mar 11 16:29 

wesc ttyp2 Mar 11 16:40 (192.168.1.37) 
wesc ttyp3 Mar 11 16:49 (192.168.1.37) 
wesc ttyp4 Mar 11 17:51 (192.168.1.34) 


14. 5. 6 相关 函数 


表 14. 7 列 出 了 可 以 执行 上 述 任务 的 函数 《〈 及 其 模块 ) 





aa + 
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表 14.7 各 种 文件 执行 函数 




















文件 对 象 属性 描述 

os/popen2. popen2 () 执行 文件 ， 打 开 文 件 ， 从 新 创建 的 运行 程序 读 取 (stdout)， 或 者 向 
该 程序 写 (stdin) 

os/popen2. popen3 Q 执行 文件 ,打开 文件 ,从 新 创建 的 运行 程序 读 取 (stdout 和 stder) , 
或 者 各 该 程序 写 (stdin) 

os/popen2. popen4’ () 执行 文件 ， 打 开 文 件 ， 从 新 创建 的 运行 程序 读 取 (结合 stdout, 














stdout) ， 或 者 向 该 程序 写 (stdin) 

commands. getoutput () 在 子 进程 中 执行 文件 ， 以 字符 串 返 回 所 有 的 输出 © 

subprocess. call'() 创建 subprocess 的 便捷 函数 。 Popen 等 待命 令 完 成 ， 然 后 返回 状 
态 代码 ; 与 os. system 0 类 似 ， 但 是 是 较 灵 活 的 替代 方案 








a. python2. 0 版 新 加 入 
b.  python2. 0 时 加 入 到 os 和 popen2 模块 中 
c. python2.4 时 加 入 





14. 6 受 限 执行 
在 python 历史 某 个 时 期 内 ， 存 在 着 使 用 了 rexec 和 bastion 模块 的 限制 执行 的 概念 。 第 一 个 
模块 允许 沙 盒 (sandbox) 中 的 执行 代码 修改 内 建 对 象 。 第 二 个 模块 用 来 过 滤 属 性 和 包装 你 的 类 。 然 
而 ， 由 于 一 个 显著 的 缺点 和 弥补 安全 漏洞 的 困难 ， 这 些 模块 便 被 废弃 了 。 那 些 维护 使 用 了 这 些 模块 
的 老 代码 的 人 员 可 能 会 用 到 这 两 个 模块 的 文档 。 





























14. 6 结束 执行 


当 程 序 运 行 完 成 ， 所 有 模块 最 高 级 的 语句 执行 完毕 后 退出 ， 我 们 便 称 这 是 干净 的 执行 。 可 能 有 
很 多 情况 ， 需 要 从 python 提前 退出 ， 比 如 某 种 致命 错误 ， 或 是 不 满足 继续 执行 的 条 件 的 时 候 。 









































在 python 中 ， 有 各 种 应 对 错误 的 方法 。 其 中 之 一 便 是 通过 异常 和 异常 处 理 。 另 外 一 个 方法 便 是 
建造 一 个 “清扫 器 ”方法 , 这 样 便 可 以 把 代码 的 主要 部 分 放 在 if 语句 里 , 在 没有 错误 的 情况 下 执行 ， 
因而 可 以 让 错误 的 情况 “正常 地 “终结 。 然 而 ， 有 时 也 需要 在 退出 调用 程序 的 时 候 ， 返 回 错误 代码 
以 表明 发 生 何 种 事件 。 


















































14.7.1 sys.exit( and SystemExit 
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立即 退出 程序 并 返回 调用 程序 的 主要 方式 是 sys 模块 中 的 exit ( 函数 。sys. exit O MIEN: 














sys. exit (status=0) 


当 调用 sys. exit Qi, BUS systemExit QO 异常。 除非 对 异常 进行 监控 在 一 个 try 语句 和 
合适 的 except 子 句 中 )， 异 常 通常 是 不 会 被 捕捉 到 或 处 理 的 ， 解 释 器 会 用 给 定 的 状态 参数 退出 ， 如 
果 没 有 给 出 的 话 , 该 参数 默认 为 0。 System Exit 是 唯一 不 看 作 错 误 的 异常 。 它 仅仅 表示 要 退出 python 
的 愿望 。 


























sys. exit 0 经 常用 在 命令 调用 的 中 途 发 现 错误 之 后 ， 比 如 ， 如 果 参 数 不 正 确 ， 无 效 ， 或 者 参数 
数目 不 正确 。 下 面 的 例子 14.4 Cargs. py) 仪 仅 是 一 个 测试 脚本 ， 在 正确 执行 之 前 需要 给 出 确定 数目 
的 参数 。 





















































执行 这 个 脚本 我 们 得 到 如 下 输出 : 


$ args. py 
At least 2 arguments required (incl. cmd name). usage: args. py argl arg? 
[arg3... J 
$ args. py XXX 
At least 2 arguments required (incl. cmd name). usage: args. py argl arg? [arg3... J 
$ args. py 123 abc 
number of args entered: 3 
args (incl. cmd name) were: ['args.py , '123', 'abc'] 
$ args. py -x -2 foo 
number of args entered: 4 
args (incl. cmd name) were: [ args. py’, °x’, '-2, 
’ foo’ | 


Example 14.4 Exiting Immediately (args. py) 立即 退出 (args. py) 





调用 sys. exit O 使 python 解释 器 退出 。exit O 的 任何 整数 参数 都 会 以 退出 状态 返回 给 调用 者 ， 
该 值 默认 为 0; 





Ig!/usr/bin/env python 

2 

Jimport sys 

4 

5def usage(): 

6print “At least 2 arguments (incl. cmd name). ' 
(print "usage: args. py are! are? fares... J 
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sys. exit (1) 

9 

10 arge = len (sys. argv) 

ll if arge < 3: 

12 usage) 

13 print “number of args entered:^, argc 





14 print “args (incl. cmd name) were:^, sys. argv 





许多 命令 行 驱动 的 程序 在 进行 之 前 ， 用 脚本 的 核心 功能 测试 了 输入 的 有 效 性 。 如 果 验 证 失败 ， 
那么 便 调用 usage O 函数 去 告知 用 户 什 么 样 的 问题 会 导致 这 个 错误 , 并 “提示 ”用户 如 何 才能 正确 地 调 
用 脚本 。 














14.7.2 sys. exitfunc() 


sys. exitfunc () 默 认 是 不 可 用 的 ， 但 你 可 以 改写 它 以 提供 额外 的 功能 。 当 调用 了 sys. exit OFF 
在 解释 器 退出 之 前 ， 就 会 用 到 这 个 函数 了 。 这 个 函数 不 带 任何 参数 的 ， 所 以 你 创建 的 函数 也 应 该 是 
无 参 的 。 
如 果 sys. exitfunc 已 经 被 先前 定义 的 exit 函数 履 盖 了 , 最 好 的 方法 是 把 这 段 代 码 作为 你 exit O 
函数 的 一 部 分 来 执行 。 一 般 说 来 ，exit 函数 用 于 执行 某 些 类 型 的 关闭 活动 ， 比 如 关闭 文件 和 网 络 连 
接 ， 最 好 用 于 完成 维护 任务 ， 比 如 释放 先前 保留 的 系统 资源 。 



































下 面 的 例子 介绍 了 如 何 设置 exit 0 函数 ， 如 果 已 经 被 设置 了 ， 则 确保 执行 该 函数 : 





import sys 
prev exit func = getattr(sys, 'exitfunc', None) 


def my exit func(old exit = prev exit func): 

E. 

# perform cleanup TAE 

E. 

if old exit is not None and callable(old exit): 
old exit 0 


sys. exitfunc = my exit func 


在 清理 执行 以 后 ， 我 们 执行 了 老 的 exit O MAR. getattr 0) 调用 只 是 检查 了 先前 的 exitfunc () 
是 否 已 经 定义 。 如 果 没 有 ， 那 么 prev_exit func IMAX None, 否则 ， prev exit func 变 成 exit M 














$— 一 * 一 
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数 新 的 别名 ， 然 后 作为 参数 传 入 我 们 的 新 exit RAL, my exit func. 
对 getattr O 的 调用 可 以 这 样 写 : 
if hasattr(sys, 'exitfunc'): 
prev exit func = sys. exitfunc# getattr (sys, 'exitfunc') 


else: 
prev exit func = None 


14.7.3 os. exit() Function os. exit) 函数 





os 模块 的 _exit O 函数 不 应 该 在 一 般 应 用 中 使 用 。( 平 台 相 关 , 只 适用 特定 的 平台 , 比如 基于 Unix 
的 平台 ， 以 及 Win32 平台 )。 其 语法 为 : 


os. exit(status) 
































这 个 函数 提供 的 功能 与 sys. exit OF sys. exitfunc() 相 反 ， 根 本 不 执行 任何 清理 便 立 即 退 出 
python。 与 sys. exit () 不 同 ， 状 态 参 数 是 必需 的 。 通 过 sys. exit () 退 出 是 退出 解释 器 的 首选 方法 。 


$ 14.7.4 os.killO Function E 


os 模块 的 kill O 函数 模拟 传统 的 unix 函数 来 发 送信 号 给 进程 。kil11l 0) 参数 是 进程 标识 数 (PID) 
和 你 想 要 发 送 到 进程 的 信号 。 发 送 的 典型 信号 为 SIGINT，SIGQUIT, 或 更 彻底 地 ，SIGKILL, 来 使 进程 
终结 。 


一 从 一 | 











14.8 各 种 操作 系统 接口 





在 一 章 中 ， 我 们 已 看 到 各 种 通过 os 模块 和 操作 系统 进行 交互 的 方法 。 我 们 看 到 的 大 多 数 函数 都 
是 处 理 文 件 或 外 部 进程 执行 。 这 里 有 些 方法 允许 对 现在 的 用 户 和 进程 有 较 特 殊 的 动作 ， 我 们 将 简要 
地 看 看 。 表 14. 8 中 描述 的 大 部 分 函数 只 在 posix 系统 上 工作 ， 除 非 标 明了 适用 于 Windows 环境 。 


























Table 14.8 各 种 os 模块 属性 

os 模块 属性 描述 

uname () 获得 系统 信息 〈 主 机 名 ， 操 作 系统 版 本 ， 补 丁 级 别 ， 系统 构架 等 等 ) 
getuid( /setuid (uid) 获取 /设置 现在 进程 的 真正 的 用 户 ID 

getpidO /getppidO 获取 真正 的 现在 / 父 进程 ID (PID) (由 

getgidO /setgid(gid) 获取 /设置 现在 进程 的 群 组 ID 
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getsidÜ /setsidO 获取 会 话 ID(SID) 或 创建 和 返回 新 的 SID. 



































umask (mask) 设置 现在 的 数字 unmask， 同 时 返回 先前 的 那个 (mask 用 于 文件 许可 ) QW) 

getenv (ev) / 

putenv(ev, value), 

environ 获取 和 设置 环境 变量 ev 的 值 ; os. envion 属性 是 描述 当前 所 有 环境 变量 
的 字典 @ 





geteuid( /setegidO ”获取 /设置 当前 进程 的 有 效用 户 ID (GID) 
getegid()/setegid() ”获取 /设置 当前 进程 的 有 效 组 ID (GID) 





getpgid (pid) / 

setpgid(pid, pgrp) 获取 和 设置 进程 GID 进程 PID; 对 于 get, 如 果 pid 为 0， 便 返回 现在 进 
程 的 进程 GID 

getlogin() 返回 运行 现在 进程 的 用 户 登 录 

times () 返回 各 种 进程 时 期 的 元 组 QD 

strerror (code) JB IBLE 吴 代 人 码 对 应 的 错误 信息 

getloadavgO* 返回 代表 在 过 去 1，5，15 分 钟 内 的 系统 平均 负载 值 的 元 组 。 





a. python2. 3 时 加 入 


表 14.9 执行 环境 相关 模块 。 


: 模块 描述 : 
atexit" 注册 当 python 解释 器 退出 时 候 的 执行 句柄 





popen2 提供 额外 的 在 os. popen 之 上 的 功能 : (提供 通过 标准 文件 和 其 他 的 进程 交 互 
IEA; 对 于 python2. 4 和 更 新 的 版 本 ， 使 用 subpross) 
commands 提供 额外 的 在 os. system 之 上 的 功能 : 把 所 有 的 程序 输出 保存 在 返回 的 





字符 串 中 与 输出 到 屏幕 的 相反 );， 对 于 python2. 4 和 更 新 的 版 本 ， 使 
用 subpross © 

















getopt 在 这 样 的 应 用 程序 中 的 处 理 选 项 和 命令 行 参 数 

Site 处 理 site-specific 模块 或 包 

platform 底层 平台 和 架构 的 属性 

subprocess' 管理 〈 计 划 替 代 旧 的 函数 和 模块 ， 比 如 os. system(),  os.spawn*O, 








os.popen*(),  popen2.*, command. *) 
a. python2. 0 时 加 入 


b. python2. 3 时 加 入 
c. python2.4 时 加 入 


14. 9 相关 模块 
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在 表 14.9 H, ER T os 和 sys 模块 ， 你 还 可 以 找到 与 这 章 执行 环境 主题 相关 的 模块 列表 。 











14.10 练习 


14-1. 可 调用 对 象 。 说 出 python 中 的 可 调用 对 象 。exec YE RR A EA eval () 有 什么 不 同 ? 








14-2. input raw. input).  PJ&reAZ raw input () 和 input() 有 什么 不 同 ? 





14-3. 执行 环境 。 创 建 运行 其 他 python 脚本 的 python 脚本 





14-4. os.system() 。 选 择 熟 悉 的 系统 命令 ， 该 命令 执行 任务 时 不 需要 输入 ， 也 不 输出 到 屏幕 
或 根本 不 输出 任何 东西 。 调 用 os. system () 运行 程序 





附加 题 ， 你 的 解决 方案 移植 到 subprocess. callO 
14-5. commands. getoutput (). 用 commands. getoutput O 解决 前 面 的 问题 


14-6. popen) 家族。 选择 熟悉 的 系统 命令 , 该 命令 从 标准 输入 获得 文本 , 操作 或 输出 数据 。 
使 用 os. popen () 与 程序 进行 通信 。 输 出 到 哪儿 呢 ? 使 用 popen2. popen2 () RE. 


14-7. | subprocess 模块 。 把 先前 问题 的 解决 方案 移植 到 subprocess 模块 。 


14-8. exit 冰 数 。 设 计 一 个 在 程序 退出 时 的 函数 。 安 装 到 sys. exitfunc () ， 运 行程 序 ， 演 
示 你 exit 函数 确实 被 调用 了 。 

















14-9. ”shells。 创建 shell (操作 系统 接口 ) 程序 。 给 出 接受 操作 系统 命令 的 命令 行 接口 ( 任 


意 平 台 ) 


附加 题 1: 支持 管道 ( 见 os 模块 中 的 dup 0)，dup20, F pipe (函数 )。 管 道 过 程 允 许 进程 的 标 
准 输入 连接 到 男 一 个 进程 的 标准 输入 。 

















附加 题 2:， 用 括号 支持 逆序 的 管道 ， 给 shell 一 个 函数 式 编程 接口 。 换 句 话说 ， 支 持 更 加 函数 
式 风格 如 . . . sort (grep (ps -ef，root)，-n，+1)， 而 不 是 ps -ef | grep root | sort -n tl... 
这 样 的 命令 








14-10. fork()/exec*() 和 spawn*() 的 比较 . 使 用 fork ()-exec* () 对 和 spawn*() 家 族 函 数 有 什 
么 不 同 ?” 那 一 组 的 功能 更 强 ? 


14 - 11. 生成 和 执行 python 代码 。 用 funcAttrs. py 脚本 例 14. 4) 加 入 测试 代码 到 已 有 程序 的 
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函数 中 。 创 建 一 个 测试 框架 ， 每 次 遇 到 你 特殊 的 函数 属性 ， 它 都 会 运行 你 的 测试 代码 。 
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Chapter 1 = 


15. 1 介绍 /动机 


























处 理 文本 和 数据 是 件 大 事 。 如 果 您 不 相信 我 说 的 话 ， 请 仔细 看 看 现 如 今 的 计算 机 主要 都 在 做 些 
什么 工作 。 文 字 处 理 、 网 页 填 表 、 来 自 数据 库 的 信息 流 、 股 票 报价 信息 、 新 闻 列 表 ， 这 个 清单 还 会 






































不 断 地 增长 。 因 为 我 们 可 能 不 知道 这 些 需 要 计算 机 编程 处 理 文本 或 数据 的 具体 内 容 ， 所 以 能 把 这 些 
文本 或 数据 以 某 种 可 被 计算 机 识别 和 处 理 的 模式 表达 出 来 是 非常 有 用 的 。 























假设 我 在 运营 一 个 电子 邮件 档案 公司 ， 而 您 是 我 的 一 位 顾客 ， 比 如 说 ， 您 想 获得 自己 去 年 二 月 
闻 收 发 的 所 有 邮件 ， 如 果 我 能 设计 一 个 计算 机 程序 来 整理 信息 然后 将 它 转发 给 您 ， 而 不 是 通过 人 工 
方法 通读 您 的 邮件 后 再 手动 地 处 理 您 的 请 求 ， 如 此 处 理 将 会 非常 不 错 。 因 为 如 果 有 人 会 看 遍 您 的 邮 
件 信息 ， 哪 怕 只 是 是 用 眼睛 看 一 下 邮件 上 的 时 间 ， 您 可 能 都 会 对 此 感到 担心 (甚至 愤怒 )。 又 比如 ， 
您 可 能 会 认为 几 是 带 有 “ILOVEY0U” 这 样 主题 的 邮件 都 是 已 感染 病毒 的 信息 ， 并 要 求 从 您 的 个 人 邮 
箱 中 删除 它们 。 这 就 引出 一 个 问题 , 我 们 如 何 通过 编程 使 计算 机 具有 在 文本 中 检索 某 种 模式 的 能 

























































































正则 表达 式 (RE) 为 高 级 文本 模式 匹配 ， 以 及 搜索 - 蔡 代 等 功能 提供 了 基础 。 正 则 表达 式 (RE) 是 一 
些 由 字符 和 特殊 符号 组 成 的 字符 串 ， 它 们 描述 了 这 些 字符 和 字符 的 某 种 重复 方式 ， 因 此 能 按 某 种 模 
式 匹配 一 个 有 相似 特征 的 字符 串 的 集合 ， 因 此 能 按 某 模式 匹配 一 系列 有 相似 特征 的 字符 串 ， 见 图 15 
-1。 换 句 话说 ,它们 能 匹配 多 个 字符 串 - 一 个 只 能 匹配 一 个 字符 串 的 RE 模式 是 乏味 且 毫 无 作用 的 ， 


你 说 是 不 是 ? 

































































Edit By Vheavens 


Edit By Vheavens 








15-1 你 可 以 用 这 个 正则 表达 式 匹 配 有 效 的 Python 标志 符 。” [A-Za-zj\w+ ”的 含义 是 : 
第 一 个 字符 是 字母 ， 即 ， 由 大 写字 母 A 到 2 或 是 小 写字 母 a 到 z 组 成 ， 它 后 面 至 少 (+) 跟 有 一 个 由 字 
母 或 数字 组 成 的 字符 (\w). 如 图 ， 你 看 到 有 很 多 字符 串 被 过 滤 ， 只 有 那些 符合 我 们 要 求 的 RE 模式 的 
字符 串 被 筛选 出 来 。 比 如 ,“4x2”， 因 为 它 是 以 数字 开头 的 ， 所 以 被 过 滤 了 。 


Python 通过 标准 库 的 re 模块 支持 正则 表达 式 (RE) 。 本 节 我 们 将 向 你 简要 地 介绍 这 。 限 于 篇 幅 ， 
内 容 将 仅 涉 及 Python 编程 中 正则 表达 式 (RE) 方面 最 常见 的 内 容 。 你 们 (对 正则 ) 的 经 验 (熟悉 程度 ) 此 
定 不 同 。 我 们 强烈 建议 您 阅读 一 些 官方 帮助 文档 和 与 此 主题 有 关 的 文本 。 那 么 你 对 字符 串 的 理解 方 
式 就 会 有 所 改变 。 





核心 笔记 : 查找 与 匹配 的 比较 

本 章 通 篇 涉及 到 对 查找 和 匹配 用 法 的 讲述 。 当 我 们 完全 讨论 与 字符 串 中 模式 有 关 的 正则 表达 式 
时 ,我 们 会 用 术语 “matching”(“ 匹 配 ”) ， 指 的 是 术语 pattern-matching (模式 匹配 ) 。 在 Python 
专门 术语 中 ， 有 两 种 主要 方法 完成 模式 匹配 : 搜索 (searching) 和 匹配 (matching). 。 搜 索 ， 即 在 字符 
串 任 意 部 分 中 查找 匹配 的 模式 ， 而 匹配 是 指 ， 判 断 一 个 字符 串 能 否 从 起 始 处 全 部 或 部 分 的 匹配 某 个 
模式 。 搜 索 通 过 search O 函数 或 方法 来 实现 ， 而 匹配 是 以 调用 match O 函数 或 方法 实现 的 。 

总 之 ， 当 我 们 说 模式 的 时 候 ， 我 们 全 部 使 用 术语 “matching”(“ 匹 配 ”) ; 我们 按照 Python 如 





ps aa + 
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何 完成 模式 匹配 的 方式 来 区 分 “搜索 ”和 “匹配 ”。 

15. 1. 1 您 的 第 一 个 正则 表达 式 

我 们 上 面 已 经 提 到 ， 正 则 表达 式 是 含有 文本 和 特别 字符 的 字符 串 ， 这 些 文本 和 特别 字符 描述 的 
模式 可 以 识别 各 种 字符 串 。 我 们 还 简单 盖 述 了 正则 表达 式 字 母 表 ， 以 及 用 于 匹配 通用 文本 的 正则 表 
达 式 字母 表 一 一 所 有 大 小 写字 母 及 数字 的 集合 。 也 存在 特别 的 字母 表 ， 比 如 ， 只 含有 字符 “0“ 和 ?1 
的 字母 表 ， 该 字母 表 可 以 表示 所 有 二 进 制 整数 的 集合 ， 即 ，”0, “1, "00," "OL ^ "10," “11,” 
“100, ”等 . 

让 我 们 看 看 正则 表达 式 的 基本 情况 ， 虽 然 正则 表达 式 常 被 视 为 是 “高 级 主题 ” 有 时 候 它们 也 是 
非常 简单 的 。 我 们 列 出 一 些 用 一 般 文 本 的 标准 字母 组 成 简单 的 正则 表达 式 及 它们 所 描述 的 字符 串 。 
以 下 的 正则 表达 式 是 最 基本 ， 最 普通 的 。 它 们 仅 由 一 个 字符 串 定义 了 一 个 模式 , 该 模式 仅 匹 配 这 个 字 
符 串 本 身 ， 该 字符 串 由 正则 表达 式 定义 。 以 下 是 正则 表达 式 (RE) 和 匹配 它们 的 字符 串 。 
























































RE Pattern String(s) Matched 
foo foo 
Python Python 
abc123 abc123 








上 表 中 第 一 个 正则 表达 式 模 式 是 “foo“。 这 个 模式 不 包含 任何 特殊 符号 去 匹配 其 他 符号 ， 它 仅 匹 
配 自身 所 描述 的 ， 所 以 只 有 字符 串 ^foo” 匹配 此 模式 。 同 理 ,“Python” 和 “abc123. ”也 一 样 。 正 则 
表达 式 的 强大 之 处 在 于 特殊 符号 的 应 用 ， 特 殊 符 号 定义 了 字符 集合 ， 子 组 匹配 ， 模 式 重 复 次 数 。 正 
是 这 些 特殊 符号 使 得 一 个 正则 表达 式 可 以 匹配 字符 串 集合 而 不 只 是 一 个 字符 串 。 

15. 2 正则 表达 式 使 用 的 特殊 符号 和 字符 

ME, 我 们 来 介绍 最 常用 的 元 字符 (metacharacters) 一 一 特殊 字符 和 符号 ， 正 是 它们 赋予 了 正则 
表达 式 强 大 的 功能 和 灵活 性 。 正 则 表达 式 中 最 常见 的 符号 和 字符 见 表 15.1. 

表 15.1 常用 正则 表达 式 符号 和 特殊 字符 























记号 说 明 举例 
Symbols 

literal 匹配 字符 审 的 值 foo 

rel|re2 匹配 正则 表达 式 rel 或 re2 foo|bar 

匹配 性 何 字 符 GT TRE} b.b 

Ji 匹配 字符 审 的 开始 ^Dear 

$ 匹配 字符 审 的 结尾 /bin/*sh$ 

‘ 匹配 前 面 出 现 的 正则 表达 式 零 次 或 多 次 [A-Za-z0-9]* 

4 匹配 前 面 出 现 的 正则 表达 式 一 次 或 Bik [a-z]+\.com 

? 匹配 前 面 出 现 的 正则 表达 式 零 次 或 一 次 goo? 

{N} PURC AT rn c ELSE RE AR [0-9] {3} 
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Symbols 描述 

符号 

(M,N) RESHMA 到 起 太 的 的 正则 表达 式 

[...] ”区 配 字 符 组 里 出 现 的 任意 一 个 字符 

[. T 匹配 从 字符 x 到 ly 中 的 任意 一 个 字符 

Vin 

[*.--] 不 匹配 此 字符 集中 出 现 的 任何 一 个 字符 , 8. 
eRe CHOSE EHE RE D t 


cl] Siigmeg" kam" e 
(po 站 各 下 有 次数 符号 (e 


(...) 匹配 封闭 括号 中 正则 表达 式 QE) ,并 保存 为 子 组 


Special Characters 


\d 匹配 任何 数字 ， 和 [0-9] 一 样 AD 是 “d BRM: 任何 
SESE) 


\w 


\s 匹配 任何 空白 符 ， 和 [ \nitiriwif] 相同 ，(S X is 
Bie 8) 


Ab PLAC Sha (8B 是 BEES) 


\nn 匹配 已 保存 的 子 蛤 (请 参考 上 面 的 正则 表达 式 符号 : 


Vc E eR c (QD, RB'EBOREES M, TEIL 


\A (\Z) BWBRcrRSBBElS (结束 ) 


匹配 性 何 涩 字 字 母 字符 ， 和 [A- Za-:0-9 ] 相同 (ur 是 
\w KIRS) 





正则 表达 式样 例 


[0-9] {5,9} 
[aeiou] 


[0-9], [A- 
Za-z] 


[^aeiou], 
[^&-Za-z0- 


([0-9] (3))?, 
f (o0 |u) bar 


data\d+.txt 


[A-Za-z_] \w+ 


of\sthe 


\bThe\b 


price: \16 


\ADear 


15.2. 1 用 管道 符号 ( | ) 匹 配 多 个 正则 表达 式 模 式 


管道 符号 ( | )， 就 是 您 键盘 上 的 竖 枉 ， 表 示 一 个 或 操作 ， 它 的 意思 是 选择 被 管道 符号 分 隔 的 
多 个 不 同 的 正则 表达 式 中 的 一 个 。 例 如 ， 下 面 的 一 些 使 用 或 操作 的 模式 ， 和 它们 所 匹配 的 字符 串 : 





—9— 


e 
+e 
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+ | t 


正则 表达 式 模式 ”匹配 的 字符 串 


at | home at, home 
r2d2|c3po r2d2, c3po 
bat | bet |bit bat, bet, bit 





有 了 这 个 符号 ， 正 则 表达 式 的 灵活 性 增强 了 ， 使 得 它 可 以 匹配 不 止 一 个 字符 串 ,，“ 或 ”( 操 作 ) 
有 时 候 也 被 叫做 “联合 ”(union) 或 者 逻辑 或 (OR) 。 














15. 2. 2 匹配 任意 一 个 单个 的 字符 ( . ) 





点 字符 或 句号 (. ) 符 号 匹配 除 换行 符 (NEWLINE) 外 的 任意 一 个 单个 字符 (Python 的 正则 表达 式 有 
一 个 编译 标识 [S or DOTALL], 该 标识 能 去 掉 这 一 限制 , 使 (. ) 在 匹配 时 包括 换行 符 (NEWLINEs) 。) 


(这 里 括号 缺 一 半 ) 无 论 是 字母 、 数 字 、 不 包括 “\n” 的 空白 符 、 可 打印 的 字符 、 还 是 非 打 印字 符 ， 
BUE NS ES C. ) 都 可 以 匹配 他 们 。 








正 表达 式 模式 。 ”匹配 的 字符 串 





f.o te’ E 和“o” 中 间 的 任何 字符 ， 如 fao, f9o, fto 等 
- 任意 两 个 字符 

. end 匹配 在 字符 串 end 前 面 的 任意 一 个 字符 

|j: 我 怎样 才能 匹配 点 号 (dot) 或 句号 (period)? 


4: 为 了 明确 地 匹配 一 个 点 号 (dot) 本 身 ， 你 必须 (在 前 面 ) 使 用 反 和 斜 线 “\” 对 它 进行 转 义 。 





15. 2. 4 从 字符 串 的 开头 或 结尾 或 单词 边界 开始 匹配 ( /$ /Nb AB ) 





还 有 些 符 号 和 特殊 字符 是 用 来 从 字符 串 的 开头 或 结尾 开始 搜索 正则 表达 式 模 式 的 。 如 果 想 从 字 
符 串 的 开头 开始 匹配 一 个 模式 ， 你 必须 用 脱 字符 号 4 ， 即 ，Caret) 或 特殊 字符 \A (大 写字 母 A 前 
面 加 上 一 个 反 斜 线 )， 后 者 主要 是 为 那些 没有 caret 符号 的 键盘 使 用 的 ， 比 如 说 国际 键盘 。 类 似 ， 美 


元 符号 〈《$ ) 或 \2 是 用 来 ( 零 宽 度 ) 匹 配 字 符 串 的 结尾 的 。 























用 这 些 符 号 的 模式 与 我 们 将 在 本 章 讲 述 的 其 它 大 多 数 符号 是 不 同 的 ， 因 为 这 些 符号 指定 了 (匹配 
字符 ) 的 位 置 . 在 上 面 的 核心 笔记 里 , 我们 曾 说 过 “matching” 和 “searching” 之 间 的 区 别 ,“matching” 
是 试图 从 整个 字符 串 的 开头 进行 匹配 ， 而 searching" 则 可 从 一 个 字符 串 的 任意 位 置 开 始 匹 配 。 
正 因 为 这 几 个 字符 和 搜索 的 位 置 有 关 ， 所 以 需要 和 搜索 模式 一 起 使 用 。 下 面 是 几 个 “擦边球 ”的 正 
则 表达 式 搜索 模式 : 
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正则 表达 式 模式 匹配 的 字符 串 

















"From 匹配 任何 以 From 开始 的 字符 串 
/bin/tcsh$ 匹配 任何 以 /bin/tesh 结束 的 字符 串 
"Subject: hi$ 匹配 仅 由 Subject: hi 组 成 的 字符 串 








特别 说 明 ， 如 果 你 想 匹 配 这 两 个 字符 中 的 任何 一 个 (或 全 部 ) IUD RET Re Mo Pan, 
如 果 你 想 匹 配 任何 以 美元 符号 (D 结尾 的 字符 串 ， 一 个 可 行 的 解决 办 法 是 用 正则 表达 式 模 式 
& *\ $$? . 








特殊 字符 No and \B 用 来 匹配 单词 边界 。 两 者 之 间 的 区 别 是 ，\b 匹配 的 模式 是 一 个 单词 边界 ， 
就 是 说 ， 与 之 对 应 的 模式 一 定 在 一 个 单词 的 开头 ， 不 论 这 个 单词 的 前 面 是 有 字符 (该 词 在 一 个 字符 串 
的 中 间 ), 还 是 没有 字符 (该 单词 在 一 行 的 起 始 处 ) 。 同 样 地 , \B 只 匹配 出 现在 一 个 单词 中 间 的 模式 ( 即 ， 
不 在 单词 边界 上 的 字符 )。 看 下 面 儿 个 例子 : 

















RE Pattern Strings Matched 

the 任何 包含 有 “the” 的 字符 串 

\bthe 任何 以 “the” 开 始 的 字符 串 

\bthe\b 仅 匹 配 单词 "the" 

\Bthe 任意 包含 “the” 但 不 以 “the” 开 头 的 单词 


$ 15.2. 5 创建 字符 类 ([ ] ) E 


尽管 点 号 可 用 来 匹配 任意 字符 ， 但 有 时 候 你 需要 匹配 某 些 个 特殊 的 字符 。 正 因为 如 此 ， 方 括号 
CL] ) 被 发 明 出 来 。 使 用 方 括号 的 正则 表达 式 会 上 兄 配方 括号 里 的 任何 一 个 字符 。 几 个 例子 如 下 : 

















4 


正则 表达 式 模 式 匹配 的 字符 串 

blaeiu]t bat, bet, bit, but 

[cr] [23] [dp] [02] 个 包含 4 个 字符 的 字符 串 : BAFE “r” m “co”, JRE “2” 
或 “3”， 再 接 下 来 是 “d” 或 "p", 最 后 是 "o" m “2% , Jl 
如 : c2do, r3p2, r2d2, c3po, %4. 











关于 正则 表达 式  “[er][23][dp][02]” 的 一 点 要 说 明 : 如 果 只 让 “r2d2” EE “c3po” WX 
为 有 效 的 字符 串 ， 就 需要 限定 更 为 严格 的 正则 表达 式 。 但 因为 方 括号 只 有 ”逻辑 或 “(“1logical OR" ) 
的 功能 ， 所 以 用 方 括号 不 能 实现 这 一 限定 要 求 。 唯 一 的 解决 办 法 是 用 管道 符号 (pipe)， 例 如 : 
*r2d2|c3po" . 





























HT 





对 仅 有 单个 字符 的 正则 表达 式 ， 使 用 管道 符号 和 方 括号 的 效果 是 等 价 的 。 举 例 来 说 ， 正 则 表达 
A "ab" ， 只 匹配 以 “a 开头 后 面 再 跟 一 个 六“ 的 字符 串 。 如 果 我 们 只 想 要 一 个 字母 的 字符 串 ， 即 ， 
"a" 或 者 “b” 中 的 一 个 ， 就 可 以 使 用 正则 表达 式 "[ab]" 。 因 为 “a” 和 "b" 是 单个 的 





型 
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字符 串 ， 我 们 也 可 以 用 正则 表达 式 “alb”。 但 是 ， 如 果 我 们 想 用 模式 匹配 “ab“， 后 面 接着 是 “cd“ 的 
字符 串 , 就 不 能 用 方 插 号 了 , 因为 方 插 号 只 适用 于 单个 字符 的 情况 。 这 样 , 唯一 的 办 法 是 用 “ab|cd”， 
这 和 我 们 刚才 提 到 的 “r2d2|c3po” 的 道理 是 相同 的 。 























15.2.5 指定 范围 ( - ) 和 否定 ( ) 


方 括号 除 匹 配 单个 字符 外 ， 还 可 以 支持 所 指定 的 字符 范围 。 方 括号 里 一 对 符号 中 间 的 连 字 符 C) 
用 来 表示 一 个 字符 的 范围 ， 例 如 ，A - Z，a-z， BR 0-9 分 别 代 表 大 写字 母 、 小 写字 母 和 十 进 制 数 
字 。 这 是 一 个 按 字 母 顺 序 排序 的 范围 ， 所 以 它 不 限于 只 用 在 字母 和 十 进 制 数字 上 。 男 外 ， 如 果 在 左 
方 括号 后 第 一 个 字符 是 上 箭头 符号 (4 ) ， 就 表示 不 匹配 指定 字符 集 里 的 任意 字符 。 









































正则 表达 式 模式 匹配 的 字符 
z. [0-9] 字符 “z”， 后 面 跟 任意 一 个 字符 ， 然 后 是 一 个 十 进 制 数字 
[r-u] Lenv-y] [us] “r”“s,”“t” 或 “u” 中 的 任意 一 个 字符 , 后 面 跟 的 是 “e, ” 








“h, » “y, ” W, » “x, 2 或 d ud 中 的 任意 一 个 字符 ， 再 后 面 


是 字符 “u” 或 “s”. 
[aeiou] 一 个 非 元 音字 符 (练习 : ”为 什么 我 们 说 ” 非 元 音 “， 而 不 说 ” 辅 
音字 母 “?) 
[*\t\n] 除 TAB 制 表 符 和 换行 符 以 外 的 任意 一 个 字符 
[^-a] 在 使 用 ASCII 字符 集 的 系统 中 , 顺序 值 在 ““ 和 “a” 之 间 的 
任意 一 个 字符 ， 即 ， 顺 序号 在 34 和 97 之 间 的 某 一 个 字符 。 


15.2.6 使 用 闭 包 操作 符 ( *，+，?，{} ) 实现 多 次 出 现 / 重 复 匹配 


现在 我 们 来 介绍 最 常用 的 正则 表达 式 符号 ， 即 ， 特 殊 符 号 “*”，“+”， 和 “?”， 它 们 可 以 
用 于 匹配 字符 串 模 式 出 现 一 次 、 多 次 、 或 未 出 现 的 情况 。 星 号 或 称 星 号 操作 符 匹 配 它 左 边 那个 正则 
表达 式 出 现 

零 次 或 零 次 以 上 的 情况 (在 计算 机 语言 和 编译 器 原理 里 ， 此 操作 符 被 叫做 Kleene 闭 包 操作 符 ) 。 
加 号 +) 操作 符 匹 配 它 左边 那个 正则 表达 式 模 式 至 少 出 现 一 次 的 情况 ( 它 也 被 称 为 正 闭 包 操 作 符 ) m 
问号 操作 符 ( ? ) 匹配 它 左 边 那个 正则 表达 式 模 式 出 现 零 次 或 一 次 的 情况 。 



































还 有 花 括 号 操作 符 ({ D. 花 插 号 里 可 以 是 单个 的 值 ， 也 可 以 是 由 去 号 分 开 的 一 对 值 。 如 果 是 
一 个 值 ， 如 ，{N} ， 则 表示 匹配 N 次 出 现 ;， 如 果 是 一 对 值 ， 即 ，{M,，N} ， 就 表示 [匹配 Mf 次 到 N 次 出 现 。 
可 以 在 这 些 符 号 前 用 反 和 斜 线 进行 转 义 ， 使 它们 失去 特殊 作用 ， 即 ， Nx" 将 匹配 星 号 本 身 等 。 























在 上 表 中 ， 我 们 注意 到 问号 出 现 了 不 只 一 次 (被 重 载 ), 问号 有 两 种 含义 :1. 单独 使 用 时 表示 匹配 
出 现 零 次 或 一 次 的 情况 ，2. 紧 跟 在 表示 重复 的 元 字符 后 面 时 ， 表 示 要 求 搜索 引擎 匹配 的 字符 串 越 短 
gU. pu. C?) 
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前 面 提 到 ” 越 短 越 好 . ..“ 是 什么 意思 呢 ? 当 使 用 了 表示 重复 的 元 字符 (*+? (m, n) ) 时 ， 正 则 表达 式 
引擎 在 匹配 模式 时 会 尽量 “吸收 "更 多 的 字符 。 这 就 叫做 "贪心 *。 问 号 告诉 正则 表达 式 引 擎 尽 可 能 地 
偷懒 ， 要 求 当前 匹配 消耗 的 字符 越 少 越 好 ， 留 下 尽 可 能 多 的 字符 给 后 面 的 模式 (如 果 存 在 )。 - 在 本 
章 末 尾 ， 我 们 举 一 个 有 代表 性 的 例子 来 说 明 必 须 使 用 非 贪心 模式 的 情况 。 





























现在 ， 让 我 们 接着 来 看 一 些 使 用 闭 包 操作 符 的 例子 : 




















RE Pattern Strings Matched 
[dn]ot? 字符 “d 或 “0“， 后 面 是 一 个 “0 ， 最 后 是 最 多 一 个 字符 “t”, 即 , do, no, dot, 
not 
0? [1-9] 从 1 到 9 中 的 任意 一 位 数字 ， 前 面 可 能 还 有 一 个 0“. 例如; 可 以 把 它 看 
成 一 月 到 九 月 的 数字 表示 形式 ， 不 管 是 一 位 数字 还 是 两 位 数字 的 表示 形 
3s 
[0-9] (15, 16) 15 或 16 位 数字 表示 ， 例 如 : 信用 卡号 码 
(2| >]+> 匹配 所 有 合法 (和 无 效 的 ) HTML. 标签 的 字符 串 





[KQRBNP] [a-h] [1-8]- [a-h] [1-8] 在 “长 代数 ” 记 谱 法 中 , 表示 的 国际 象棋 合法 的 棋盘 。 
Bl, “K, » “Q, » “R， » “B, » “N, ” 或 «p» 等 
字母 后 面 加 上 两 个 用 连 字 符 连 在 一 起 的 “al” 到“h8” 之 间 


的 棋盘 坐标 。 前 面 的 编号 表示 从 哪里 开始 走 棋 ， 后 面 的 
编号 代表 走 到 哪个 位 置 \ 棋 格 ) 去 。 


15.2.7 ”特殊 字符 表示 字符 集 






































我 们 还 提 到 有 一 些 特殊 字符 可 以 用 来 代表 字符 集合 。 例 如 ， 你 可 以 不 使 用 “0 - 9” 这 个 范围 
表示 十 进 制 数字 ， 而 改 用 简写 “\d” 表 示 。 男 一 个 特殊 的 字符 w 可 用 来 表示 整个 字符 数字 的 
字符 集 ， 即 相当 于 “A-Za-z0-9_” 的 简写 形式 ， 特 殊 字符 “\s” 代表 空白 字符 。 这 些 特殊 字符 的 大 
写 形式 表示 不 匹配 ， 比 如 ,“\D” 表示 非 十 进 制 数字 的 字符 (等 价 于 “[ 0-9] ”)， 等 等 。 我 们 来 
看 几 个 运用 这 些 简写 形式 的 稍 复杂 的 例子 : 



































正则 表达 式 模 式 匹配 的 字符 串 
\w+-\d+ 一 个 由 字母 或 数字 组 成 的 字符 串 ， 和 至 少 一 个 数字 ， 两 部 分 中 间 由 连 
字符 连接 
[A-Za-z] \w* 第 一 个 字符 是 字母 ， 其 余 字 符 (如 果 存 在 的 话 ) ， 是 字母 或 数字 ( 它 几 乎 
等 价 于 Python 语言 中 合法 的 标识 符 [ 见 参考 练习 ]) 
\d{3}-\d {3}-\d {4} (美国 ) 电话 号 码 ， 前 面 带 区 号 前 经， 例如 800-555-1212 
\w+@\w+\. com 简单 的 XXX@YYY. com 格式 的 电子 邮件 地 址 
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15.2.8 用 圆 括号 (O) 组建 组 





现在 ， 或 许 我 们 可 以 匹配 一 个 字符 串 和 丢弃 那些 不 匹配 的 字符 串 了 ， 但 有 时 候 ， 我 们 也 许 对 匹 
配 的 数据 本 身 更 有 兴趣 。 我 们 不 仅 想 知道 是 否 整个 字符 串 匹 配 我 们 的 条 件 \ 正 则 表达 式 ) ， 还 想 在 匹 
配 成 功 时 取出 某 个 特定 的 字符 串 或 子 字 符 串 。 要 达到 这 个 目的 ， 只 需要 给 正则 表达 式 的 两 边 加 上 一 
对 圆 括号 。 


























一 对 圆 括 号 (0) 和 正则 表达 式 一 起 使 用 时 可 以 实现 以 下 任意 一 个 (或 两 个 ) 功能 : 


e 对 正则 表达 式 进 行 分 组 
e 于 配子 组 

















有 时 你 需要 对 正则 表达 式 进行 分 组 ， 其 中 一 个 很 好 的 例子 就 是 ， 你 要 用 两 个 不 同 的 正则 表达 式 
去 比较 一 个 字符 串 。 男 一 个 理由 是 为 整个 正则 表达 式 添加 一 个 重复 操作 符 ( 即 不 是 仅 重 复 单 个 字符 或 
单一 字符 集 ) 。 









































使 用 圆 括号 的 一 个 额外 好 处 就 是 匹配 的 子 串 会 被 保存 到 一 个 子 组 ， 便 于 今后 使 用 。 这 些 子 组 可 
以 在 同一 次 匹配 或 搜索 中 被 重复 调用 ， 或 被 提取 出 来 做 进一步 处 理 。 在 小 节 15.3.9 的 结尾 你 会 读 


























到 一 些 提取 子 组 的 例子 。 

为 什么 需要 使 用 子 组 匹配 呢 ? 主要 是 有 时 除了 进行 匹配 操作 外 ， 你 还 想 要 提取 匹配 模式 的 内 容 。 
如 果 想 知道 在 成 功 的 匹配 中 ， 是 哪些 字符 串 匹 配 了 我 们 的 正则 表达 式 模 式 。 例 如 ， 我 们 想 用 正则 表 
达 式 “\w+-\d+” 匹 配 一 些 内 容 ， 但 又 想 把 第 一 部 分 的 字符 和 第 二 部 分 的 数字 分 别 保存 ， 该 怎么 做 呢 ? 





如 果 我 们 给 两 个 子 模式 都 加 上 圆 括号 ， 即 ， 将 它 写 成 “(wt)-(\dt)” ， 那 我 们 就 可 以 对 这 
两 个 匹配 的 子 组 分 别 进行 访问 了 。 当 然 你 也 可 以 使 用 其 他 方法 达到 同样 目的 , 比如 , 先 写 一 段 代码 判 
断 是 否 找到 匹配 的 对 象 ， 然 后 再 执行 另 一 个 程式 (也 必须 再 写 一 段 代码 ) 来 解析 整个 匹配 的 部 分 ， 从 
中 提取 出 两 个 部 分 来 。 然 而 相 比 之 下 把 正则 表达 式 划 分 为 子 组 是 更 好 的 实现 办 法 ， 因 为 Python 已 经 
在 re 模块 里 支持 此 功能 ， 那 为 什么 不 让 Python 来 做 这 项 工作 ， 而 非 要 重复 发 明 一 个 轮子 呢 ? 




















正则 表达 式 模 式 匹配 的 字符 串 

Ad (V. Nd) ? 表示 简单 的 浮 点 数 ， 即 ， 任意 个 十 进 制 数字 ， 后 面 跟 一 个 可 选 的 小 
数 点 , 然后 再 接 零 或 多 个 十 进 制 数字 。 例 如 :“0. 004, ”“2, ”“75. ”， 
AE Af 
SPP 


(Mr?s?\. )?[A-Z]la-z]* [ A-Za-z-]* = 名字 和 姓氏 ， 对 名 字 的 限制 ( 首 字母 大 写 ， 其 它 字 
母 (如 果 存 在 ) 小 写 )， 全 名 前 有 可 选 的 称谓 (“Mr. ，” 
“Mrs.,” “Ms.,” 或 “M.,”)， 姓 氏 没 有 什么 
限制 ， 人 允许 有 多 个 单词 、 横 线 、 大 写字 母 。 
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15.3 IEJIZEXA AURI Python 语言 











既然 我 们 已 知道 了 有 关 正 则 表达 式 本 身 的 所 有 知识 ， 那 让 我 们 来 详细 研究 当前 Python 的 默认 正 
则 表达 式 模块 re 模块 吧 . re 模块 在 Pythonl. 5 版 本 被 引入 。 如 果 你 正在 使 用 Python 的 早期 版 本 ， 
你 将 只 能 用 已 过 时 的 regex. regsub 模块 。 这 些 模块 具有 Emacs 风格 ， 功 能 不 丰富 ， 而 且 与 现在 的 
re 模块 也 不 兼容 。regex 和 regsub 这 两 个 模块 已 在 Python 2.5 版 本 时 被 移 了 除了， 在 Python2.5 及 
其 后 续 版 本 ， 引 入 这 两 个 模块 中 的 任何 一 个 将 会 引发 Import Error 异常 。 











但 正则 表达 式 本 身 是 不 变 的 ， 所 以 本 小 节 中 的 大 多 数 基 本 概念 仍然 适用 于 旧版 的 regex 和 
reg-sub 模块 。 与 旧 模 块 形成 鲜明 对 比 的 是 ， 新 的 re 模块 支持 功能 更 强大 、 更 通用 的 Perl Kk (AL 
体 说 是 Perlb 的 风格 ) 的 正则 表达 式 ， 人 允许 多 线程 共享 同一 经 过 编译 的 正则 表达 式 对 象 ， 同 时 它 还 支 
持 对 正则 表达 式 分 组 进行 命名 和 按 名 字 调 用 。 另 外 ， 有 一 个 名 叫 reconvert 的 转换 模块 是 帮助 开发 
者 从 regex/regsub 模块 迁移 到 re 模块 的 。 但 请 注意 ， 正 则 表达 式 有 不 同 的 风格 ， 我 们 主要 研究 当 
4 Python 语言 中 使 用 的 正则 表达 式 。 














re 引擎 已 在 Pythonl. 6 版 本 中 被 重 写 ， 改 进 了 它 的 性 能 并 添加 了 对 Unicode 的 支持 。 接 口 并 没 
有 改变 ， 因 此 模块 的 名 字 也 保持 不 变 。 新 的 re 引擎 ， 内 部 被 叫做 sre, BRS 1.5 版 本 中 内 部 名 为 


pcre 的 re 引擎 。 E 
15.3.1 re 模块 : 核心 函数 和 方法 


表 15.2 WHS re 模块 最 常用 的 函数 和 方法 。 其 中 有 很 多 函数 也 与 已 编译 的 正则 表达 式 对 象 
(regex objects) 和 正则 ?匹配 对 象 ”(RE “match objects” ) 的 方法 同名 并 且 具 有 相同 功能 。 



































在 本 小 节 ， 我 们 来 看 两 个 主要 的 函数 /方法 ，match() 和 search(), UK compile eA. Æ F 
一 节 我 们 还 会 再 介绍 更 多 个 ， 但 如 果 想 进一步 了 解 我 们 涉及 或 没有 涉及 的 更 多 相关 信息 ， 我 们 建议 
你 参阅 Python 的 文档 。 














表 15.2 常见 的 正则 表达 式 函 数 与 方法 








函数 /方法 描述 
re 模块 的 函数 
compile (pattern, flags-0) 对 正则 表达 式 模 式 pattern 进行 编译 ,flags 是 可 选 标 志 符 ， 


并 返回 一 个 fegex 对 象 
re 模块 的 函数 和 regex 对 象 的 方法 
match(pattern,string, flags-0) 尝试 用 正则 表达 式 模 式 pattern 匹配 字符 串 string, 

















Edit By Vheavens 


ee 


Edit By Vheavens 





T 


2H) 


flags 是 可 选 标 志 符 ， 如 果 匹 配 成 功 ， 则 返回 一 个 匹配 对 
; 否则 返回 None 
search(pattern, string, flags-0) 在 字符 串 string 中 查找 正则 表达 式 模式 pattern 的 第 
一 次 出 现 ，flags 是 可 选 标志 符 ， 如 果 匹 配 成 功 ， 则 返回 
一 个 匹配 对 象 ， 否 则 返回 None 
findall(pattern,stringl,flags])' 在 字符 串 string 中 查找 正则 表达 式 模式 pattern 的 所 有 
( 非 重 复 ) 出 现 ， 返 回 一 个 匹配 对 象 的 列表 
finditer(pattern,string[, flags])' 和 findall( 相 同 ， 但 返回 的 不 是 列表 而 是 迭代 器 ， 对 
于 每 个 匹配 ， 该 迭代 器 返回 一 个 匹配 对 象 
































K 15.3 常见 的 正则 表达 式 函 数 与 方法 (继续 ) 


























函数 /方法 描述 
匹配 对 象 的 方法 
split (pattern, string, max=0) 根据 正则 表达 式 pattern 中 的 分 隔 符 把 字符 string I% 





为 一 个 列表 ， 返 回 成 功 匹 配 的 列表 ， 最 多 分 割 max 次 ( 默 
认 是 分 割 所 有 匹配 的 地 方 ) 。 

sub (pattern, repl, string, max-0) 把 字符 串 string 中 所 有 匹配 正则 表达 式 pattern 的 地 
方 替 换 成 字符 串 repl, 如 果 max 的 值 没 有 给 出 , 则 对 所 有 
匹配 的 地 方 进行 奉 换 (另外 ， 请 参考 subnO, 它 还 会 返回 


























一 个 表示 替换 次 数 的 数值 ) 。 
group (num-0) 返回 全 部 匹配 对 象 (或 指定 编号 是 num 的 子 组 ) 
groups () 返回 一 个 包含 全 部 匹配 的 子 组 的 元 组 (如果 没有 成 功 匹 配 ， 就 返回 一 个 空 元 














a. Python 1.5.2 中 新 增 ; 2.4 中 增加 标识 参数 
b. Python 2.2 新 增 ; 2.4 中 增加 标识 参数 








核心 笔记 : RE 编译 ( 何 时 应 该 使 用 compile 函数 ?) 
在 第 十 四 章 ， 我 们 曾 说 过 Python 的 代码 最 终 会 被 编译 为 字 节 码 , 然后 才 被 解释 器 执行 。 我 们 特 


别提 到 用 调用 eval) 或 exec 调用 一 个 代码 对 象 而 不 是 一 个 字符 串 ， 在 性 能 上 会 有 明显 地 提升 ， 
这 是 因为 对 前 者 来 说 ， 编 译 过 程 不 必 执 行 。 换 名 话说， 使 用 预 编 译 代 码 对 象 要 比 使 用 字符 串 快 ， 
为 解释 器 在 执行 字符 串 形式 的 代码 前 必须 先 把 它 编 译 成 代码 对 象 。 


这 个 概念 也 适用 于 正则 表达 式 , 在 模式 匹配 之 前 , 正则 表达 式 模式 必须 先 被 编译 成 regex 对 象 。 


由 于 正则 表达 式 在 执行 过 程 中 被 多 次 用 于 比较 ， 我 们 强烈 建议 先 对 它 做 预 编译 ， 而 且 ， 既 然 正则 表 
达 式 的 编译 是 必须 的 ， 那 使 用 么 预先 编译 来 提升 执行 性 能 无 疑 是 明智 之 举 。re. compile() 就 是 用 来 
提供 此 功能 


其 实 模块 函数 会 对 已 编译 对 象 进行 缓存 ， 所 以 不 是 所 有 使 用 相同 正则 表达 式 模式 的 search () 和 


match () 都 需要 编译 。 即 使 这 样 ， 你 仍然 节省 了 查询 缓存 ， 和 用 相同 的 字符 串 反 复 调 用 函数 的 性 能 开 
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销 。 在 Pythonl. 5. 2 版 本 里 ， 缓 存 区 可 以 容纳 20 个 已 编译 的 正则 表达 式 对 象 ， 而 在 1.6 版 本 里 ， 
由 于 另外 添加 了 对 Unicode 的 支持 , 编译 引擎 的 速度 变 慢 了 一 些 , 所 以 缓存 区 被 扩展 到 可 以 容纳 100 
个 已 编译 的 regex 对 象 。 





15.3.2 使 用 compile 0 编译 正则 表达 式 











我 们 稍 后 要 讲 到 的 大 多 数 re 模块 函数 都 可 以 作为 regex 对 象 的 方法 。 注 意 ， 尽 管 我 们 建议 预 纺 
译 ， 但 它 并 不 是 必需 的 。 如 果 你 需要 编译 ， 就 用 方法 ， 如 果 不 需 要 ， 可 以 使 用 阔 数 。 幸 运 的 是 无 论 
你 用 哪 种 方式 -函数 还 是 方法 ， 名 字 都 是 相同 的 。 (也 许 你 曾 对 此 好 奇 ， 这 正 是 模块 函数 和 方法 完全 
一 样 的 原因 ， 例 如 ，search)，match0 等 等 ) 在 后 面 的 例子 里 ， 我 们 将 用 字符 串 ， 这 样 可 以 省 去 一 
个 小 步 又。 我 们 仍 会 用 到 几 个 预 编 译 代 码 对 象 ， 这 样 你 可 以 知道 它 的 过 程 是 怎么 回 事 。 
































编译 rex 对 象 时 给 出 一 些 可 选 标志 符 ， 可 以 得 到 特殊 的 编译 对 象 。 这 些 对 象 将 允许 不 区 别 大 小 
写 的 匹配 ， 或 使 用 系统 的 本 地 设置 定义 的 字母 表 进行 匹配 等 。 详 情 请 参阅 有 关 文 档 。 这 些 标 志 符 也 
可 以 做 为 参数 传 给 模块 (GE) ”版 本 的 match() 和 search O 进行 特定 模式 的 匹配 ， 其 中 一 些 标志 符 
已 在 前 面 做 过 简短 介绍 (例如 ，DOTALL, LOCALE) - 这 些 标志 符 多 数 用 于 编译 ， 也 正 因 如 此 它们 可 以 
被 传 给 模块 版 本 的 match() 和 search O , Tfj match O £I search() 肯 定 要 对 正则 表达 式 模式 编译 一 次 。 
如 果 你 想 在 regex 对 象 的 方法 中 使 用 这 些 标志 符 ， 则 必须 在 编译 对 象 时 传递 这 些 参数 。 






































除 下 面 的 方法 外 ，regex 对 象 还 有 一 些 数据 属性 ， 其 中 两 个 是 创建 时 给 定 的 编译 标志 符 和 正则 
表达 式 模 式 。 











15.3.3 匹配 对 象 和 groupO, groupsO 方法 














在 处 理 正 则 表达 式 时 , 除 regex 对象 外 ,还 有 男 一 种 对 象 类 型 - 匹配 对 象 . 这 些 对 象 是 在 match () 
或 search 0 被 成 功 调 用 之 后 所 返回 的 结果 。 匹 配对 象 有 两 个 主要 方法 : grop) 和 groupsO. 


VH 





























group (方法 或 者 返回 所 有 匹配 对 象 或 是 根据 要 求 返 回 某 个 特定 子 组 。groups O 则 很 简单 ， 它 返 
回 一 个 包含 唯一 或 所 有 子 组 的 元 组 。 如 果 正 则 表达 式 中 没有 子 组 的 话 ， groups) 将 返回 一 个 空 元 
组 ， 而 group O 仍 会 返回 全 部 匹配 对 象 。 








Python 语言 中 的 正则 表达 式 支 持 对 匹配 对 象 进行 命名 的 功能 ， 这 部 分 内 容 超 出 了 本 介绍 性 小 节 
对 正则 表达 式 的 讨论 范围 。 我 们 建议 你 阅读 re 模块 的 文档 ， 里 面 有 我 们 省 略 掉 的 关于 这 些 高 级 主题 
的 详细 内 容 。 




















15. 3. 4 用 match 0 匹配 字符 串 
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我 们 先 来 研究 re 模块 的 函数 、 正 则 表达 式 对 象 regex object) 的 方法 : match(). match () PR 
数 尝试 从 字符 串 的 开头 开始 对 模式 进行 匹配 。 如 果 匹 配 成 功 ， 就 返回 一 个 匹配 对 象 ， 而 如 果 匹 配 失 
败 了 ,就 返回 None。 匹 配对 象 的 group () 方法 可 以 用 来 显示 那个 成 功 的 匹配 。 下 面 是 如 何 运 用 match O 
[及 groupO ] 的 一 个 例子 : 





> m = re.match( foo’, ’foo’)  £ pattern matches string , PRrtVLAP FIJE 
2 if m is not None: # show match if successful WERD, kale 
m. group () 


’ Foo’ 


模式 “foo “完全 匹配 字符 串 “foo“。 在 交互 解析 器 中 ， 我 们 能 确定 m 就 是 一 个 匹配 对 象 的 实例 。 














>>> m  # confirm match object returned ”确定 返回 匹配 对 象 
<re. MatchObject instance at 80ebf48> 





这 是 当 匹 配 失败 时 的 例子 ， 它 返回 None: 


2» m = re.match( foo’, 'bar')& pattern does not match string RICS VLIB FIJA 
22^ if m is not None: m. group (-line version of if clause) —f7f¥ if fy 
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上 面 的 匹配 失败 ， 所 以 m 被 赋值 为 None, 因为 我 们 写 的 if 语句 中 没有 什么 行动 ， 所 以 也 没有 什 
么 指令 动作 被 执行 。 在 以 后 的 例子 中 ， 为 了 简洁 ， 在 可 能 的 情况 下 ， 我 们 会 省 去 if 检查 语句 ， 但 在 
实际 编程 中 ,最 好 写 上 它 , 以 防止 出 现 AttributeError 异常 (失败 后 返回 None， 此 时 它 是 没有 group 0 
属性 [方法 ] 的 ) 。 

















即使 字符 串 比 模式 要 长 ， 匹 配 也 可 能 成 功 ;， 只 要 模式 是 从 字符 串 的 开始 进行 匹配 的 。 例 如 ， 模 
Th’ foo” FEF FFE “food on the table” 中 找到 一 个 匹配 ， 因 为 它 是 从 该 字符 串 开 头 进行 匹配 的 : 





> m = re.match( foo’, 'food on the table’) # match succeeds # MAK 
252 m. group () 
’ foo’ 





如 你 看 到 的 ， 尽 管 字 符 串 比 模式 要 长 ， 但 从 字符 串 开 头 有 一 个 成 功 的 匹配 。 EB "foo" ZE MGE 
个 较 长 的 字符 串 中 抽取 出 来 的 匹配 部 分 。 
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我 们 甚至 可 以 充分 利用 Python 语言 面向 对 象 的 特性 ， 间 接 省 略 中 间 结 果 ， 将 最 终结 果 保存 到 一 
起 : 


2^» re.match( foo’, 'food on the table’). group 0 
’ foo’ 





注意 ， 上 面 的 例子 中 ， 如 果 匹 配 失败 ， 会 引发 一 个 AttributeError 异常 . 


15.3.5 search) 在 一 个 字符 串 中 查找 一 个 模式 (搜索 与 匹配 的 比 
较 ) 








其 实 ， 你 要 搜索 的 模式 出 现在 一 个 字符 串 中 间 的 机 率 要 比 出 现在 字符 串 开 头 的 机 率 更 大 一 些 。 
这 正 是 search() 派 上 用 场 的 时 候 。search 和 match 的 工作 方式 一 样 ， 不 同 之 处 在 于 search 会 检查 
参数 字符 串 任 意 位 置 的 地 方 给 定 正则 表达 式 模 式 的 匹配 情况 。 如 果 搜 索 到 成 功 的 匹配 ， 会 返回 一 个 
匹配 对 象 ， 否 则 返回 None. 




















现在 我 们 来 举例 说 明 match O 和 search(O 之 间 的 区 别 。 让 我 们 举 一 个 对 长 字符 串 进 行 匹配 的 例 
子 。 这 次 ， 我 们 用 字符 串 “foo“ 去 匹配 “seafood”: 

> m = re.match( foo’, 'seafood') # no match DLRA 

25» if m is not None: m. group Q) 
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如 你 所 见 ， 这 里 没有 匹配 成 功 。match (尝试 从 字符 串 起 始 处 进行 匹配 模式 ， 即 ， 模 式 中 的 f” 
试 匹 配 到 字符 串 中 首 字母 “<s$ 上， 这 样 匹 配 肯 定 是 失败 的 。 但 字符 串 “foo ”确实 出 现在 “seafood” 
中 ， 那 我 们 如 何 才能 让 Python 得 出 肯定 的 结果 呢 ? 答案 是 用 search O Kr. search) 查找 字符 串 
中 模式 首次 出 现 的 位 置 ， 而 不 是 尝试 (在 起 始 处 ) 匹配 。 严 格 地 说 ，search 0) 是 从 左 到 右 进 行 搜索 。 


























2M» m = re.search( foo’, "seafood’) # use search() instead KH search Q 
25^ if m is not None: m. group (Q) 


'foo'  # search succeeds where match failed JH search KIVA, H match Ul e Me 
225 











在 本 小 节 以 后 的 内 容 里 ， 将 通过 大 量 的 例子 展示 如 何在 Python 语言 中 运用 正则 表达 式 , 我 们 会 
用 到 regex 对 象 的 方法 match O 和 search O ， 匹 配对 象 的 方法 group 0. groups), ， 以 及 正则 表达 式 
语法 中 的 绝 大 多 数 特殊 字符 和 符号 。 
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15.3.6 匹配 多 个 字符 串 ( |) 





在 15.2 小 节 里 ， 我 们 在 正则 表达 式 “bat|bet|bit” 中 使 用 了 管道 符号 .， 下面， 我 们 把 这 个 正 
则 表达 式 用 到 Python 的 代码 里 : 





2» bt = "bat/bet/bit’# RE pattern: bat, bet, bit HIEW KAT: bat, bet, bit 
> m = re.match(bt, 'bat') # bat? is a match # bat! 起 [VLBW 

25^ if m is not None: m. group Q 

"bat! 

>> m = re amatch(bt, bit’) # no match for 'bit' HAULER blt' ffi 

25^ if m is not None: m. group Q) 


2» m = re.match(bt, "He bit me!’)# does not match string ILE FFP 
25^ if m is not None: m. group () 


> m = re. search (bt, 'He bit me!’)# found ’bit’ via search — EfE£zvS/W bit’ 
25^ if m is not None: m. group Q 


' bit 


15.3. 7 匹配 任意 单个 字符 ( . ) 





以 下 的 例子 中 ， 我 们 将 说 明 点 号 是 不 能 匹配 换行 符 或 非 字符 ( 即 , 空 字符 串 ) 的 : 


22^ anyend = '.end' 
2» m = re.match(anyend, 'bend') # dot matches 'b' Eu WA b’ 
25^ if m is not None: m. group () 


"bend" 
>>> m = re.match(anyend, 'end') # no char to match SIE FIP VEAL 
25^ if m is not None: m. group () 


> m = re.match(anyend, '|nend')  # any char except |n ALP FPF An BROW) 
25» if m is not None: m. group () 


2» m = re. search(’. end’, 'The end. ’)# matches ' ' in search . HULA” 
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25^ if m is not None: m. group () 





了 


end' 








下 面 的 例子 是 来 搜索 一 个 真正 点 号 (小数点) 的 正则 表达 式 ， 在 正则 表达 式 中 ， 用 反 斜 线 对 它 进 
行 转 义 ， 使 点 号 失去 它 的 特殊 意义 : 


MM patt3l4 = '3. Id # RE dot giE MEX 
M» pi patt = '3|. Id # literal dot (dec. point) BE UA) 
2» m = re.match(pi_patt, '3.14') # exact match "EIL 


25^ if m is not None: m. group Q 

"a. IL 

2» m = re.match(patt314, '3014') # dot matches '0* Z5 AE CO 

25^ if m is not None: m. group Q) 

"3014" 

2» m = re.match(patt314, '3. 14) # dot matches ’.’ Am o^ 
25» if m is not None: m. group () 


"a. 14" 


15.3.8 创建 字符 集合 ([ ] ) 





前 面 ， 我 们 曾 讨论 过 “[cr] [23] [dp] [o2] ”和 “rzr2d2|c3po” 是 不 同 的 。 从 下 面 的 例子 中 ， 可 
以 看 出 “r2d2|c3po” 与 “[crj[23] [dp] [02]” 相 比 有 更 加 严格 的 限制 : 


2» m = re.match( [cr/[23][dp][o02]’, 'c3po')f matches ’c3po’ AULA’ c3po* 
25^ if m is not None: m. group () 


'cdpo* 

>» m = re.match( [er/[23][dp]/[o2]’, 'c2do')f matches 'c2do' AIL c2do’ 
25^ if m is not None: m. group () 

"cdo' 

2» m = re.match(r2d2/c3po’, 'c2do')* does not match 'cZdo' C VE c2do’ 


25» if m is not None: m. group Q 


2» m = re.match(r2d2/c8po’, 'r2d2/')f matches 'r2d2' AVL r2d2’ 





$— 一 * 一 
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255^ if m is not None: m. group () 





a 
15.3.9 重复、 特殊 字符 和 子 组 


正则 表达 式 中 最 常见 的 情况 包括 特殊 字符 的 使 用 ， 正 则 表达 式 模式 的 重复 出 现 ， 以 及 使 用 圆 括 
号 对 匹配 模式 的 各 部 分 进行 分 组 和 提取 操作 。 我 们 曾 看 到 过 一 个 关于 简单 电子 邮件 地 址 的 正则 表达 
IA ( “\wt@\wt\. com”)， 或 许 我 们 想 要 匹配 的 邮件 地 址 比 这 个 正则 表达 式 的 允许 的 要 多 。 比 如 ， 为 
了 在 域名 前 添加 主机 名 称 支 持 ， 即 ， 支持 “www. xxx. com”， 而 不 只 是 允许 “xxx. com” 做 整个 域名 ， 
我 们 就 必须 修改 现 有 的 正则 表达 式 。 为 了 表示 主机 名 是 可 选 的 ， 我 们 要 写 一 个 模式 匹配 主机 名 (后 面 
跟 一 个 点 号 ) ， 然 后 用 问号 “?” 表 示 此 模式 可 出 现 0 次 或 1 次 ， 表 示 此 部 分 是 可 选 的 ， 再 把 这 个 可 
选 的 正则 表达 式 插入 到 我 们 前 面 的 那个 正则 表达 式 中 去 :“\w+@Qwt\. )?\w+t\. com". 。 从 下 面 的 例 
子 中 可 以 看 出 ， 这 个 表达 式 容 许 “. com” 前 面 有 一 个 或 两 个 名 字 : 









































222 patt = ' w*e(|w*|. ) ?|w*|. com’ 
2» re.match(patt, 'nobodyÉxxx. com’). group Q 


'nobodyÉxxx. com’ 


2^» re.match(patt, 'nobodyOwww. xxx. com’). group 0 
'nobodywww. xxx. com’ 


接 下 来 ， 我 们 用 以 下 模式 进一步 扩展 我 们 的 例子 ， 人 允许 任意 数量 的 子 域名 存在 。 请 特别 注意 细 
节 的 变化 ， 将 ? M x: “\wt@(\wt\. )*\wt\. com” : 





222 patt = ' \wt@(\wt\. )*|w*|. com’ 
22^ re.match(patt, 'nobodyÜwww. xxx. yyy. zzz. com’). group () 


"nobodywww. xxx. Yyy. ZZZ. com 


但 我 们 必须 要 说 明 的 是 仅 用 字母 或 数字 组 成 的 字符 不 能 满足 邮件 地 址 中 可 能 出 现 的 各 种 字符 。 


上 述 正则 表达 式 不 匹配 如 “xxx-yyy. com" 这 样 的 域名 或 其 他 带 有 非 单词 字符 (如 “\W” 等 ) 的 域名 。 





























前 面 ， 我 们 曾 讨论 过 用 括号 匹配 并 保存 子 组 做 进一步 处 理 的 好 处 ， 这 样 做 比 在 确定 正则 表达 式 
匹配 后 ， 再 单 写 一 个 子 程序 来 解析 一 个 字符 串 要 好 。 我 们 还 特别 提 到 用 来 匹配 以 一 分 隔 的 字母 或 
数字 组 成 的 字符 串 和 数字 串 的 正则 表达 式 “\w+-\d+f” ， 以 及 如 何 通过 对 此 正则 表达 式 划分 子 组 以 
构建 一 个 新 的 正则 表达 式 ，“ Qe) -Adt) ” 来 完成 任务 , 下 面 是 旧版 正则 表达 式 的 执行 情况 : 





























>> m = re. match C \w\w\w-\d\d\d’, ’abc-123’) 
25^ if m is not None: m. group Q 
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'abc-123* 





>> m = re.match( \w\w\w-\d\d\d’, ’abc-xyz’) 
25^ if m is not None: m. group Q 


Pre 





上 面 的 代码 中 , 一 个 正则 表达 式 被 用 来 匹配 由 三 个 字母 或 数字 组 成 的 字符 串 ， 再 接着 三 个 数字 的 
字符 串 。 这 个 正则 表达 式 匹 配 “abc-123” 但 不 匹配 “abc-xyz”。 我 们 现在 来 修改 正则 表达 式 ， 使 
它 能 分 别提 取 包 含 字 母 或 数字 的 部 分 和 仅 含 数字 的 部 分 。 请 注意 我 们 是 如 何 用 group 0 方法 访问 每 个 
子 组 以 及 用 groups 0 方法 获取 一 个 包含 所 有 匹配 子 组 的 元 组 的 : 











> m = re. match( (|w|ww)-(|d|d|a)', 'abc-123') 
>> m. group) # entire match fF 前 分 


'abc-123' 

> m group(1) # subgroup 1 TACHI T AH 1 
abc’ 

22^ m. group (2) # subgroup 2 DURCH FAL 2 


"123^ 


>>> m. groups)  £ all subgroups ALLTA 
Capc 123] 


如 你 所 见 ，group 0 通常 用 来 显示 所 有 匹配 部 分 ， 也 可 用 来 获取 个 别 匹配 的 子 组 。 我 们 可 用 
groups () 方 法 获得 一 个 包含 所 有 匹配 子 组 的 元 组 。 























下 面 这 个 简单 的 例子 通过 子 组 的 不 同 排列 组 合 ， 帮 助 我 们 理解 得 更 透彻 








2» m = re.match( ab’, 'ab') # no subgroups HASTA 

>> m. group) # entire match 

^ gp! 

> m. groups) # all subgroups DA BEI T A 

Q 
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> m = re.match( ab)’, 'ab') # one subgroup | &—f-F£d 

2» m. group) # entire match E E PS 

^ ap 

>>> m.group(1) # subgroup 1 AVLACHIF AL 7 

^ ap 

2» m. groups) # all subgroups EE PUB AH n 
[e— ——é$-—— 一 个) A 
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Cab’, ) 

225 

2» m = re.match( (a) ©)’, ’ab’) # two subgroups | EFT f-F Zl 
2» m. group) # entire match 











ob? 
2> m group(1) # subgroup 1 DLRI THA 1 
5o 
2» m. group (2) # subgroup 2 PUE FAL 2 
rp? 
>>> m. groups) # all subgroups DALL FAW AA 
Ca’, 4 
225 
2» m = re. match( (a(b))', 'ab') # two subgroups AD SAL 
2» m. group) # entire match A AVL ACE ZA 
ap? 
>»> m group(1) # subgroup 1 BILBO FAL 1 
ob? 
2» m group (2) # subgroup 2 SILBER FAL 2 
^p? 
>>> m. groups)  # all subgroups DA LLI TAHTA 
Cab’, “Bb? 


15.3.10 从 字符 串 的 开头 或 结尾 匹配 及 在 单词 边界 上 的 匹配 








下 面 的 例子 强调 了 锚 点 性 正则 表达 式 操作 符 。 这 些 锚 点 性 正则 表达 式 操作 符 主 要 被 用 于 搜索 而 
不 是 匹配 ， 因 为 match O) 总 是 从 字符 串 的 开头 进行 匹配 的 。 





2» m = re.search(’ The’, 'The end’) # match AVL A 
25^ if m is not None: m. group () 


' The’ 
> m-research( The’, 'end. The’) # not at beginning | fT TEJFXL 


25^ if m is not None: m. group Q 


2» m = re.search(r'|bthe!, 'bite the dog’) # at a boundary  ffEWLUJK 
25^ if m is not None: m. group () 


> m = re search(r’ \bthe’, 'bitethe dog’) # no boundary ITUR 





$— 一 * 一 
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25^ if m is not None: m. group Q 





2» m = re. search (r° \Bthe’, 'bitethe dog’) # no boundary IT UA 
25^ if m is not None: m. group () 


'the* 





你 可 能 在 这 里 注意 到 了 原始 字符 串 (raw strings) 的 出 现 。 在 本 章 末 尾 的 核心 笔记 中 ， 有 关于 
它 的 说 明 。 通 常 ， 在 正则 表达 式 中 使 用 原始 字符 串 是 个 好 主意 。 














你 还 应 该 了 解 另外 四 个 re 模块 函数 和 regex 对 象 方法 : findallO, sub, subnO 和 split (0 
15. 3. 11 用 findall (找到 每 个 出 现 的 匹配 部 分 


findallO 自 Pythonl. 5. 2 版 本 被 引入 。 它 用 于 非 重 县 地 查找 某 字 符 串 中 一 个 正则 表达 式 模 式 出 
现 的 情况 。findall() 和 search O 相似 之 处 在 于 二 者 都 执行 字符 串 搜索 但 findall () 和 match 0 与 
search() 不 同 之 处 是 ，findall 0 总 返回 一 个 列表 。 如 果 findall O 没有 找到 匹配 的 部 分 ， 会 返回 空 

列表 ; 如 果 成 功 找到 匹配 部 分 ， 则 返回 所 有 匹配 部 分 的 列表 ( 按 从 左 到 右 出 现 的 顺序 排列 ) 。 


> re. findall( car’, 'car') 
[ car’ ] 


2» re. findall( car’, ’scary’) 

[’car’] 

> re. findall( car’, ‘carry the barcardi to the car’) 
Ľ car’, "nar, “car j 




















包含 子 组 的 搜索 会 返回 更 复杂 的 一 个 列表 ， 这 样 做 是 有 意义 的 ， 因 为 子 组 是 允许 你 从 单个 正则 
表达 式 中 抽取 特定 模式 的 一 种 机 制 ， 比 如 ， 匹 配 一 个 完整 电话 号 码 中 的 一 部 分 (例如 ， 区 号 ) ， 或 完 
整 电子 邮件 地 址 的 一 部 分 (例如 ， 登 录 名 ) 。 











正则 表达 式 仅 有 一 个 子 组 时 ，findall 0) 返回 子 组 匹配 的 字符 串 组 成 的 列表 ;如 果 表 达 式 有 多 个 
子 组 ， 返 回 的 结果 是 一 个 元 组 的 列表 ， 元 组 中 每 个 元 素 都 是 一 个 子 组 的 匹配 内 容 ， 像 这 样 的 元 组 (每 
一 个 成 功 的 匹配 对 应 一 个 元 组 ) 构 成 了 返回 列表 中 的 元 素 。 这 些 内 容 初次 听 到 可 能 令 人 费解 ， 但 如 果 
你 看 看 各 种 例子 ， 就 会 明白 了 。 




















15.3.12 HjsubO [和 subn0] 进 行 搜索 和 替换 








有 两 种 函数 /方法 用 于 完成 搜索 和 代 蔡 的 功能 : sub ORI subnO. 二 者 几乎 是 一 样 的 ， 都 是 将 某 
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oP prp FIR AR DL ROTE JU de e sS IU BB HET BH. Foe EROS ENR {ELL BT AE 
是 一 个 函数 ， 该 函数 返回 一 个 用 来 替换 的 字符 串 。subn () 和 sub O — FF, (AE RIK [8] — GS 8 HR UC 
数 的 数字 ， 蔡 换 后 的 字符 串 和 表示 蔡 换 次 数 的 数字 作为 一 个 元 组 的 元 素 返 回 。 














2» re. subl X, 'Mr. Smith’, 'attn: X|n|nDear X, \n’) 
'attn: Mr. Smith|012|012Dear Mr. Smith, |012' 

225 

2» re.subn( X, 'Mr. Smith’, 'attn: X\n\nDear X, |n) 


Cattn: Mr. Smith|012|012Dear Mr. Smith, \012’, 2) 

»»»> 

2» print re.sub( X, 'Mr. Smith’, 'attn: X\n\nDear X, \n’) 
attn: Mr. Smith 


Dear Mr. Smith, 
2» re.sub( [ae], °X, 'abcdef") 
’XbcdXf’ 


> re. subn( [ae/’, °X, 'abcdef") 
C XbcaXf', 2) 


15. 3. 13 用 split Q 分 割 (分 隔 模式 ) 





re 模块 和 正则 表达 式 对 象 的 方法 split O 与 字符 串 的 split 0 方法 相似 , 前 者 是 根据 正则 表达 式 
模式 分 隔 字 符 串 ， 后 者 是 根据 固定 的 字符 串 分 割 , 因此 与 后 者 相 比 ， 显 车 提升 了 字符 分 割 的 能 力 。 如 
果 你 不 想 在 每 个 模式 匹配 的 地 方 都 分 割 字 符 串 ， 你 可 以 通过 设 定 一 个 值 参 数 ( 非 零 ) 来 指定 分 割 的 最 
大 次 数 。 

















如 果 分 隔 符 没 有 使 用 由 特殊 符号 表示 的 正则 表达 式 来 匹配 多 个 模式 ， 那 re. split O 和 
string. split () 的 执行 过 程 是 一 样 的 ， 见 以 下 的 例子 (在 每 一 个 冒号 处 分 隔 ) : 














2 re. split lI, uwirltsirifstr2 2 
[ strl', '"str2', 'str3'/ 


但 运用 正则 表达 式 后， 我 们 会 发 现 re. split 0 成 了 一 个 功能 更 强大 的 工具 。 比 如 ，Unix 系统 下 
who 命令 输出 所 有 已 登录 系统 的 用 户 的 信息 : 


% who 
wesc console Jun 20 20:33 


E 





$— 一 * 一 














Edit By Vheavens 


Edit By Vheavens 


ee 
T 


wesc pts/9 Jun 22 01:38(192. 168. 0. 6) 
wesc pts/1 Jun 20 20:33(:0. 0) 
wesc pts/2 Jun 20 20:33(:0. 0) 
wesc pts/4 Jun 20 20:93(:0. 0) 
wesc pts/3 Jun 20 20:33(:0. 0) 
wesc pts/5 Jun 20 20:33 (:0. 0) 
wesc pts/6 Jun 20 20:33(:0. 0) 
wesc pts/7 Jun 20 20:33(:0. 0) 
wesc pts/8 Jun 20 20:33(:0. 0) 








假如 我 们 想 要 保存 用 户 的 登录 信息 ， 比 如 说 ， 登 录 名 ， 用 户 登 录 时 的 电 传 ， 他 们 的 登录 的 时 间 
以 及 登录 地 址 。 用 上 面 的 string. split (很 难 有 效果 ， 因 为 分 陋 这 些 数据 的 空白 符号 是 毫 无 规律 且 
不 确定 的 。 还 有 一 个 问题 ， 就 是 在 登录 时 间 的 数据 中 ， 月 ， 日 ， 时 之 间 有 一 个 空格 。 而 我 们 一 般 想 
把 这 些 有 关 时 间 的 数据 排 在 一 起 。 



































你 需要 用 某 种 方式 来 描述 这 样 一 种 模式 :“ 在 两 个 或 更 多 个 空格 符 处 进行 分 隔 ”。 正 则 表达 式 很 
容易 做 到 这 一 点 。 我 们 能 很 快 写 出 这 个 正则 表达 式 模式 :“\sN\s+”, 含义 是 至 少 2 个 空白 字符 。 我 们 
来 写 一 个 名 为 rewho. py 的 程序 ， 它 读 入 who 命令 的 输出 - 假设 已 保存 到 名 为 whodata. txt 的 文件 

中 。 起 初 ， 我 们 写 的 rewho. py 脚本 看 起 来 像 这 样 : 








import re 
f = open( whodata. txt’, 'r' 
for eachLine in f.readlines(): 
print re. split C \s\st’, eachLine) 
f. close Q 





我 们 现在 执行 who 命令 , 将 输出 结果 保存 到 文件 whodata. txt, 然后 调用 rewho. py 来 看 看 结果 : 


% who > whodata. txt 

% rewho. py 

[’wesc’, 'console', 'Jun 20 20:33|012' / 
[’wesc’, 'pts/9', 'Jun 22 01:38\011 (192. 168. 0. 6) \012’ J 
[’wesc’, 'pts/1', 'Jun 20 20:33|011(:0. 00 |012' ] 
[ wesc’, “pts/2’, 'Jun 20 20:33|011(:0. 0) \012 ] 
[' wesc’, 'pts/4', 'Jun 20 20:33|011(:0. 0) \012 ] 
l wesc’, pts 3, "Jum 20 20-339 \011 CO. 0) \012 J 
['wesc!, 'pts/5', 'Jun 20 20:33|011(:0. 0) |012' ] 
[’wesc’, 'pts/6, 'Jun 20 20:33|011(:0. 0) |012' ] 
[' wesc’, 'pts/7, 'Jun 20 20:33|011(:0. 0) |012' ] 
['wesc!, 'pts/8', 'Jun 20 20:33|011(:0. 0) |012' ] 





$— E 
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这 是 不 错 的 尝试 ,但 还 不 完全 正确 。 首 先 ,我 们 原先 没有 预料 到 输出 中 会 包含 一 个 TAB 符号 (ASCI 
\011) ( 它 看 上 去 像 是 至 少 两 个 空格 , 对 不 ?)。 而且， 我 们 可 能 对 保存 用 来 结束 每 行 的 换行 符 NEWLINE 
(ASCII N012) ”也 没什么 兴趣 。 我 们 现在 就 做 些 改动 来 修正 这 些 问 题 ， 同 时 提升 程序 的 整体 质量 。 




















首先 ， 我 们 改 从 脚本 里 执行 who 命令 ， 而 不 是 从 外 部 调用 它 后 将 命令 的 输出 结果 保存 到 文件 
whodata. txt - 这 样 重复 的 步骤 很 快 会 令 人 厌烦 的 。 要 从 我 们 写 的 脚本 里 调用 另 一 个 程序 ， 可 以 用 
os. popen() 命令 ， 这 个 命令 在 14. 5. 2 小 节 已 介绍 过 。 尽 管 os. popen O 只 能 在 Unix 系统 中 使 用 ， 但 
本 例子 意 在 阐明 re. split O 的 用 法 ， 它 可 是 跨 系 统 平台 的 。 














我 们 去 掉 每 行 行 尾 的 换行 符 (NEWLINE) , 并 添加 检查 单个 TAB 符号 的 模式 ,把 TAB 做 为 re. split Ò 
的 可 选 分 隔 符 。 例 15. 1， 是 脚本 rewho. py 的 最 终 版 本 : 











例 15.1 Unix F who 命令 输出 结果 进行 分 隔 (rewho. py) 





此 脚本 调用 who 命令 ， 解 析 命 令 的 输出 结果 ， 根 据 不 同 的 空白 符号 分 隔 数据 。 


I1g!/usr/bin/env python 

2 

3 from os import popen 

4 from re import split 

5 

6f = popen CĈ who’, 'r') 

7for eachLine in f. readlines(): 

Sprint split( \s\st/\t’, eachLine. strip) 
9f. close() 


f.readlines() can be shortened to the file iterator f. 


YE: f.readlines O 可 以 被 简写 成 文件 的 迭代 器 下. 





运行 脚本 ， 我 们 得 到 如 下 (正确) 结果: 





% rewho. py 

[’wesc’, 'console', 'Jun 20 20:33'] 

[’wesc’, 'pts/9', 'Jun 22 01:388, '(192. 168. 0. 6)' ] 
l wesc’, ques. us 20 20:929. ° C00)" / 

I wesc’, “pts/2’, “Jom 20 20:32, ' (0.0) ] 
['wesc', 'pts/4', 'Jun 20 20:33’, °(:0.0)’/ 

[ wesc’, 'pts/3', 'Jun 20 20:33', '(:0.0)'] 

[ wesc’, 'pts/5, 'Jun 20 20:33', °(:0.0)’/ 
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[’wesc’, 'pts/6, 'Jun 20 20:33', '(:0.0)'] 
l wesc’, "npisé/7, "Jum 20 20:293. "(0.00 J 
[ wesc’, 'pts/8', 'Jun 20 20:33’, '(:0.0)'] 





在 DOS/Windows 环境 下 ， 用 dir 命令 代替 who 命令 ， 也 可 完成 此 练习 。 























趁 我 们 还 熟悉 ASCIT 字符 ， 我 们 要 提醒 注意 的 是 正则 表达 式 的 特殊 字符 和 特殊 ASCII 字符 是 容 
易 混淆 的 。 我 们 可 能 用 \n 来 表示 一 个 ASCII 换行 字符 ， 但 也 可 以 用 \d 表示 匹配 一 个 数字 的 正则 表达 
式 。 如 果 同 一 个 符号 在 ASCII 和 正则 表达 式 中 都 可 以 用 ， 就 容易 出 问题 了 ， 所 以 在 下 页 的 核心 笔记 
中 ， 我 们 推荐 使 用 Python 语言 中 的 “原始 字符 串 “ 来 避免 混淆 。 还 要 注意 :“\w” and “\W” 这 两 个 
表示 字母 或 数字 的 字符 受 L 或 LOCALE 编译 标志 符 的 影响 ， 在 Python 1.6 至 Python 2.0 以 后 的 版 
本 中 受 (U 或 UNICODE 的 )Unicode 标志 符号 影响 。 























核心 笔记 : Python 原始 字符 串 (raw strings) 的 用 法 
你 可 能 已 经 看 到 前 面 关 于 原始 字符 串 用 法 的 一 些 例 子 了 。 原 始 字符 串 的 产生 正 是 由 于 有 正则 表 
达 式 的 存在 。 原 因 是 ASCII 字符 和 正则 表达 式 特 殊 字符 间 所 产生 的 冲突 。 比 如 ， 特 殊 符 号 “\b” 在 
ASCII 字符 中 代表 退 格 键 , 但 同时 “\b” 也 是 一 个 正则 表达 式 的 特殊 符号 , 代表 “匹配 一 个 单词 边界 ”。 
为 了 让 RE 编译 器 把 两 个 字符 “\b” 当 成 你 想 要 表达 的 字符 串 ， 而 不 是 一 个 退 格 键 ， 你 需要 用 另 一 个 
反 斜 线 对 它 进行 转 义 ， 即 可 以 这 样 写 :“\\b”。 
但 这 样 做 会 把 问题 复杂 化 ， 特 别 是 当 你 的 正则 表达 式 字 符 串 里 有 很 多 特殊 字符 时 ， 就 更 容 
易 令 人 困惑 了 。 在 第 六 章 ， 我 们 曾 介 绍 过 原始 字符 串 ， 它 经 常 被 用 于 简化 正则 表达 式 的 复杂 程度 。 
事实 上 ， 很 多 Python 程序 员 在 定义 正则 表达 式 时 都 只 使 用 原始 字符 串 。 
下 面 的 例子 用 来 说 明 退 格 键 “\b” 和 正则 表达 式 “\b”( 包 含 或 不 包含 原始 字符 串 ) 之 间 的 区 别 : 
2» m = re.match( |bblow', ’blow’) # backspace, no match HERE RATE 
2 if m is not None: m. group () 


2» m = re.match(’\\bblow’, 'blow') # escaped V now it works | EI MÉE XE, BED 
Ar 
2 if m is not None: m. group () 


"blow! 
2» m = re.match(r’ \bblow’, 'blow') # use raw string instead RAHA I e SI A 
2 if m is not None: m. group (Q) 


"blow 
你 可 能 注意 到 我 们 在 正则 表达 式 里 使 用 “\d”， 没 用 原始 字符 串 ， 也 没 出 现 什么 问题 。 那 是 因为 
ASCII 里 没有 对 应 的 特殊 字符 ， 所 以 正则 表达 式 编 译 器 能 够 知道 你 指 的 是 一 个 十 进 制 数字 。 
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15. 4 正则 表达 式 示例 











现在 我 们 来 通读 一 个 详细 完整 的 例子 , 它 展 示 了 用 正则 表达 式 处 理 字符 串 的 不 同 办 法 。 第 一 步 : 
拿 出 一 段 代码 用 来 生成 随机 数据 ， 生 成 的 数据 用 于 以 后 操作 。 例 15. 2 中 , 脚本 gendata. py 生成 一 个 
数据 集 。 虽 然 程序 只 是 将 生成 的 字符 串 显 示 到 标准 输出 ， 但 此 输出 结果 也 可 以 重 定向 到 一 个 测试 文 
人 











例 15. 2 正则 表达 式 练 习 的 数据 生成 代码 (gendata. py) 
为 练习 使 用 正则 表达 式 生 成 随机 数据 ， 并 将 产生 的 数据 输出 到 屏幕 . 


l#!/usr/bin/env python 

2 

3from random import randint, choice 
4from string import lowercase 

from sys import maxint 

6from time import ctime 


7 

8 doms = ( 'com, ‘edu’, ‘net’, ‘org’, ‘gov’ ) 
9 

10 for i in range(randint (5, 10)): 
P randint (0, maxint-1) # pick date 
12 ctime(dtint) # date string 
13 
14 shorter = randint(4, 7) # login shorter 
l5 emg =~" 


16 for j in range(shorter): # generate login 
17 em += choice (lowercase) 


18 
19 longer = randint (shorter, 12) # domain longer 
20 dre" 


21 for j in range(longer): # create domain 

22 dn += choice (lowercase) 

23 

24 print °%s5::%s@%s. %s::%d-%d-%d’ % (dtstr, em, 
25 dn, choice(doms), dtint, shorter, longer) 


这 个 脚本 生成 3 个 字段 , 字段 由 一 对 冒号 , 或 双 冒 号 分 隔 。 第 一 个 字段 是 一 个 随机 (32 位 ) 整数 ， 
被 转换 为 一 个 日 期 ( 见 劳 边 的 核心 笔记 ) 。 第 二 个 字段 是 一 个 随机 产生 的 电子 邮件 (e-mail) 地 址 , 最 后 


E 





$— 一 * 一 














Edit By Vheavens 


Edit By Vheavens 


ee 





一 个 字段 是 由 单个 横 线 ( - ) 分 隔 的 一 个 整数 集合 。 





执行 这 段 代 码 ， 我 们 得 到 以 下 输出 (你 得 到 的 输出 肯定 和 本 书 中 的 不 同 ) ， 并 把 数据 保存 到 本 地 
文件 redata. txt 中 : 


Thu Jul 22 19:21:19 2004: : izspédicqdhytvhv. edu: :1090549279-4-11 
Sun Jul 13 22:42:11 2008: :zqeu@dxaibjgkniy. com: : 1216014131-4-11 
Sat May 5 16:36:23 1990: :fclihw@alwdbzpsdg. edu: :641950583-6-10 
Thu Feb 15 17:46:04 2007::uzifzfÜdpyivihw. gov: :1171590364-6-8 
Thu Jun 26 19:08:59 2036::ugxfugtjkhuqhs. net: :2098145339-7-7 
Tue Apr 10 01:04:45 2012: :zkwaq@rpxwmtikse. com: : 1334045085—5-10 











你 或 许 能 看 出 来 ， 这 个 程序 的 输出 数据 适合 用 正则 表达 式 来 处 理 。 在 我 们 逐 行 解释 后 ， 会 用 几 
个 正则 表达 式 对 这 些 数据 的 进行 操作 ， 也 为 本 章 后 面 的 练习 做 好 准备 。 





逐 行 解释 


第 1-6 行 
在 这 个 示例 脚本 里 ， 我 们 要 使 用 多 个 模块 。 但 因为 我 们 只 需要 用 到 这 些 模块 中 的 一 两 个 函数 ， 
所 以 不 必 引 入 整个 模块 ， 只 须 引 入 模块 中 某 些 属性 即 可 。 我 们 用 from-import 而 不 是 import 正 是 











基于 这 个 原因 。 代 码 第 一 行 是 Unix 起 始 提示 符 ， 后 面 是 from-import JLT. 


第 8 行 
domes 是 一 组 简单 的 包含 顶级 域名 的 集合 ， 我 们 将 从 中 随机 挑选 一 个 来 随机 生成 电子 邮件 地 址 。 


第 10-12 fT 

每 次 gendata. py 执行 都 会 产生 5-10 行 的 输出 。( 这 个 脚本 用 函数 random. randint O 生成 我 们 需 
要 的 所 有 随机 整数 。) 在 每 个 输出 行 中 ， 我 们 从 整个 可 能 的 范围 (0 到 2731-1 即 ，[sys.maxint]) 
里 ， 随 机 选 一 个 整数 ， 然 后 把 这 个 整数 用 time. ctime () 转换 成 一 个 日 期 。 大 多 数 安装 Python 的 基于 
Unix 系统 的 计算 机 上 , 系统 时 间 是 根据 1970 年 一 月 一 日 零点 -纪元 (“epoch”) 至 今 的 秒 数 来 计算 的 。 
如 果 我 们 选择 32 位 整数 ， 那 系统 日 期 就 代表 从 纪元 (epoch) 到 纪元 后 2°32 秒 之 间 的 某 个 时 刻 。 











第 14-22 fT 

我 们 规定 随机 生成 的 邮箱 地 址 中 登录 名 的 长 度 必须 在 4 到 7 个 字符 之 间 。 我 们 随机 选择 4 到 7 
个 小 写字 母 ， 依次 将 它们 连结 到 一 个 字符 串 中 。 消 数 random. choice O 的 用 处 就 是 根据 指定 序列 ， 随 
机 返回 该 序列 中 的 一 个 元 素 。 在 这 里 我 们 指定 序列 是 26 个 小 写字 母 ，string. lowercase. 我 们 规定 
虚拟 邮箱 地 址 的 域名 长 度 在 4 到 12 个 字符 之 间 ， 但 不 能 短 于 登录 名 的 长 度 。 最 后 ， 我 们 随机 选择 一 
些小 写字 母 ， 依 次 将 它们 连接 起 来 组 成 域名 。 














第 24-25 行 
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这 古本 脚本 的 关键 步骤 : 把 随机 数据 组 合 到 一 起 显示 到 输出 行 。 以 日 期 字符 串 开 头 ， 后 面 是 分 
隔 符 ， 然 后 是 随机 生成 的 电子 邮件 地 址 。 这 个 任意 的 电子 邮件 地 址 是 我 们 把 登录 名 ,“@” 符 号 ， 域 
名 和 一 个 随机 选择 的 顶级 域名 连接 到 一 起 组 成 的 。 在 最 后 一 个 双 冒 号 后 面 ， 我 们 还 加 了 一 个 随机 整 
数字 符 串 ， 它 的 前 部 分 是 与 所 选 随机 日 期 对 应 是 整数 ， 后 面 的 部 分 分 别 是 登录 名 和 域名 的 长 度 ， 这 
儿 个 整数 之 间 由 连 字符 分 隔 。 

















15.4.1 匹配 一 个 字符 串 











在 下 面 的 练习 里 ， 写 出 你 的 正则 表达 式 ， 包 括 宽松 和 限制 性 强 的 两 个 版 本 。 我 们 建议 你 用 前 面 
的 例子 redata. txt (或 你 自己 运行 gendata. py 生成 的 随机 数据 ) 来 测试 小 程序 里 的 这 些 正 则 表达 式 。 
在 做 练习 的 时 候 ， 你 还 会 再 次 用 到 这 些 数据 。 








在 把 正则 表达 式 写 入 到 我 们 的 小 程序 之 前 ， 我 们 先 要 对 它 进行 测试 。 我 们 先 引 入 re 模块 ， 将 
redata. txt 中 的 一 行 数据 赋值 到 一 个 字符 串 变 量 中 。 下 面 的 语句 在 以 下 的 两 个 示例 中 都 是 这 样 ， 没 
有 变化 。 














222 import re 
22» data = 'Thu Feb 15 17:46:04 2007: :uzifzf@dpyivihw. gov: :1171590364-6-8" 


$ 在 第 一 个 例子 中 ， 我 们 将 写 一 个 正则 表达 式 ， 用 它 从 文件 redata. txt 的 每 一 行 中 ( 仅 ) 提取 时 . 
间 惟 中 的 有 关 星 期 的 数据 字段 。 我 们 将 用 到 以 下 这 个 正则 表达 式 : 
* ^Mon/ "Tue/ Wed/ Thu/ Fri/ “Sat/Sun” 








上 例 要 求 字 符 串 是 以 所 列 出 的 七 个 字符 串 之 一 作为 开头 (“ ”正则 表达 式 操 作 符 ) 。 如 果 我 们 想 
把 上 面 的 正则 表达 式 “ 翻 译 ” 过 来 , 它 的 意思 大 概 是 : ”字符 串 必须 以 “Mon, ” “Tue, ". .. , "Sat," 
或 “Sun” 之 一 打头 um 


或 者 ， 我 们 可 以 只 用 一 个 符号， 将 日 期 字符 串 归 为 一 组 : 
* ^ Mon Tue | Wed/ Thu [Fri [Sat | Sun) " . 











在 这 组 字符 串 集 合 两 边 的 圆 括 号 表示 是 只 有 满足 这 些 字符 串 之 一 匹配 才能 成 功 。 这 是 比 我 们 前 
面 看 到 的 那个 没有 圆 括号 的 正则 表达 式 “ 更 友好 “。 而 且 ， 使 用 这 个 修改 后 的 正则 表达 式 还 有 一 个 好 
处 ， 能 使 我 们 方便 地 访问 被 匹配 字符 串 的 那个 子 组 : 

















22» patt = ' "(IMon/Tue/Wed|Thu/Fri [Sat | Sun) ' 
25^ m = re.match(patt, data) 

2» m. group) # entire match 

’ Thu’ 

>>> m group(1) # subgroup 1 
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'Thu* 
2» m groups) # all subgroups 
C Thu’, ) 














我 们 在 这 个 例子 里 所 看 到 的 功能 似乎 没有 那么 新 鲜 或 与 众 不 同 ， 但 它 对 于 下 面 的 例子 或 是 通过 
在 正则 表达 式 中 添加 额外 数据 来 处 理 字 符 串 匹配 时 就 很 有 帮助 了 ， 即 使 这 些 字 符 并 不 是 你 感 兴趣 的 
字符 串 中 的 某 部 分 。 上 面 的 两 个 正则 表达 式 都 是 限制 性 很 强 的 ， 特 别 要 求 只 含有 某 些 字符 串 。 但 在 
国际 语言 的 系统 环境 中 ， 使 用 各 地 区 本 地 化 时 间 和 缩写 的 情况 下 ， 可 能 就 行 不 通 了 。 限 制 性 更 宽松 
的 正则 表达 式 是 : ” Ww] ”。 






































这 个 正则 表达 式 只 要 求 字符 串 以 三 个 由 字符 或 数字 组 成 的 字符 作 开 头 。 要 是 把 它 翻 译 成 白话 ， 
就 是 ， 上 箭头 ( carat) 表示 以 .. .开始 ,“\w” 指 任意 一 个 由 字符 或 数字 组 成 的 字符 ,“{3} ”表示 它 
左边 描述 的 正则 表达 式 模 式 必 须 连 续 出 现 三 次 。 注 意 ， 如 果 你 要 对 这 个 正则 表达 式 分 组 ， 请 用 圆 括 
50, BJ, “ (\w{3})” i 











2» patt = ' "(w(3])' 
2» m = re.match(patt, data) 
25^ if m is not None: m. group Q 


’ Thu’ 
222 m. group (1) 


"Thu! 











注意 , 要 是 把 正则 表达 式 写 成 ” Aw) {3} ?是 不 正确 的 。 如 果 把 “ {3} ” 写 在 圆 括号 里 ((\w1{3}))， 
表示 匹配 三 个 连续 的 由 字符 或 数字 组 成 的 字符 ， 再 把 这 三 个 字符 视 为 一 个 组 。 但 如 果 把 “{3}” 挪 到 


一 


圆 括号 的 外 边 ((\w {3})， 那 现在 它 的 含义 就 变 成 三 个 连续 的 单个 由 字符 或 数字 组 成 的 字符 : 








2» patt = ' "(|w) (3]' 
2» m = re. match (patt, data) 
25^ if m is not None: m. group Q 


’ Thu’ 
2252 m. group (1) 
^u 


访问 子 组 1 的 数据 时 ， 只 看 到 “u” 是 因为 子 组 1 中 的 数据 被 不 断 地 替换 成 下 一 个 字符 。 也 就 是 
Ui, m. group (D 开始 的 结果 是 “T” 然后 是 “h”, 最 后 又 被 替换 成 “u”。 它 们 是 三 个 独立 (而 且 重 复 ) 




















的 组 ， 每 个 组 是 由 字符 或 数字 所 组 成 的 字符 ， 而 不 是 由 连续 的 三 个 字符 或 数字 组 成 的 字符 所 形成 的 
单个 组 。 
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在 下 一 个 (也 是 最 后 的 ) 例子 中 ， 我 们 将 写 一 个 正则 表达 式 来 提取 文件 redata. txt 中 每 行 末尾 的 
数值 字段 。 





15.4.2 RELA, “AE” DLAC 





在 我 们 写 正 则 表达 式 前 ， 先 明确 这 些 整 数 数据 项 是 在 字符 串 数 据 的 末尾 。 这 意味 着 我 们 有 两 种 
选择 : ER (search) 或 匹配 (match) 。 使 用 搜索 更 合适 ， 因 为 我 们 确切 地 知道 要 查找 的 数据 是 什么 (三 
个 整数 的 集合 )， 它 不 在 字符 串 的 开头 ， 也 不 是 字符 串 的 全 部 内 容 。 如 果 我 们 用 匹配 (match) 的 方法 ， 
就 不 得 不 写 一 个 正则 表达 式 来 匹配 整 行内 容 ， 并 用 子 组 保存 我 们 感 兴趣 的 那 部 分 数据 。 为 说 明 它们 
之 间 的 区 别 ， 我 们 先 用 搜索 查找 ， 再 尝试 用 匹配 来 做 ， 向 你 证 明 搜索 查找 更 适合 。 















































因为 我 们 要 查找 的 是 三 个 由 连 字 符号 C) 分 隔 的 整数 集 ， 所 以 我 们 写 出 如 下 正则 表达 式 : 
“Adr-Adt-Ndrt”。 这 个 正则 表达 式 描述 的 是 ,“ 任 意 数字 (至少 有 一 个 ) ， 后 面 有 连 字符 号 (-), 然后 是 
任意 个 数 的 数字 (至少 有 一 个 ) ， 接 着 是 另 一 个 连 字符 号 (-) ， 最 后 还 是 任意 数字 (至少 有 一 个 ) 的 集 
合 。”， 我 们 用 search 0 来 测试 这 个 正则 表达 式 : 



































22> patt = '|d*-|d*-|d** 
2)» re. search (patt, data).group() # entire match Ae BU BE ZA 


'1171590364-6-8' 

尝试 用 这 个 正则 表达 式 来 匹配 数据 会 失败 ， 这 是 为 什么 呢 ? 因为 匹配 从 字符 串 的 起 始 位 置 开始 
进行 的 ， 而 我 们 要 找 的 数值 字符 串 在 末尾 。 我 们 只 能 再 写 一 个 匹配 全 部 字符 串 的 正则 表达 式 。 还 有 
一 个 偷懒 的 办 法 ， 就 是 用 “. +” 来 表示 任意 个 字符 集 ， 后 面 再 接 上 我 们 真正 感 兴趣 的 数据 : 























patt = ueWeidge1g 
2» re.match(patt, data). group # entire match AB IL BEI ZA 
"Thu Feb 15 17:46:04 2007: :uzifzt@dpyivihw. gov: :1171590364-6-8" 








这 个 方法 不 错 ， 可 是 我 们 只 想 获得 每 行 末尾 数字 的 字段 ， 而 不 是 整个 字符 串 ， 所 以 需要 用 圆 括 
号 将 我 们 感 兴趣 的 那 部 分 数据 分 成 一 组 : 


2> patt = °. +(\d+-|d+-|d+)’ 
2» re. match (patt, data). group (1) | £ subgroup 1 plo 
'4-6-8' 
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Thu Feb 15 17:46:04 2007::uzifzf@dpyivihw.gov: :117159036|4-6-8 | 











\d+-\d+-\d+ 





A 15-2 为 什么 匹配 错 了 : + 是 贪心 的 量词 (操作 符 ) 


到 底 怎么 回 事 呢 ? 我 们 本 应 该 得 到 数据 “1171590364-6-8”， 而 不 应 该 是 “4-6-8” 啊 。 第 一 个 
整数 字段 的 前 半 部 分 到 哪里 去 了 呢 ? 原因 是 : 正则 表达 式 本 身 默认 是 贪心 匹配 的 。 也 就 是 说 ， 如 果 
正则 表达 式 模 式 中 使 用 到 通 配 字 ， 那 它 在 按照 从 左 到 右 的 顺序 求 值 时 ， 会 尽量 “ 抓 取 ”满足 匹配 的 
最 长 字符 串 。 在 我 们 上 面 的 例子 里 ,“.+” 会 从 字符 串 的 起 始 处 抓 取 满 足 模 式 的 最 长 字符 ， 其 中 包括 
我 们 想得到 的 第 一 个 整数 字段 的 中 的 大 部 分 。“\d+” 只 需 一 位 数字 就 可 以 匹配 ， 所 以 它 匹 配 了 数字 
“A” ,而 “.+” 则 匹配 了 从 字符 串 起 始 到 这 个 第 一 位 数字 “4” 之 间 的 所 有 字符 : “Thu Feb 15 
17:46:04 2007: :uzifzf@dpyivihw. gov::117159036”， 如 下 图 15 - 2. 所 示 。 








一 个 解决 办 法 是 用 “ 非 贪 歼 ”操作 符 ,“?”， 这 个 操作 符 可 以 用 在 "et, cen, 或“?” 的 
后 面 。 它 的 作用 是 要 求 正则 表达 式 引擎 匹配 的 字符 越 少 越 好 。 因 此 ， 如 果 我 们 把 “?” 放 在 “. +” 
的 后 面 ， 我 们 就 得 到 了 想 要 的 结果 ， 见 图 15 - 3 


22 patt = '. *?(|d*-d*-|d*)" 
>> re.match(patt, data).group(1)  # subgroup 1 # FH i 
'1171590364-6-8* 


? ERE “AE” (Lac 


Thu Feb 15 17:46:04 2007: :uzifzf@dpyivihw.gov: 41171590364-6-8 











.+ ? \d+-\d+-\d+ pr 


图 15-3 解决 “仿效 ”匹配 问题 ? RIE A” 匹配 


另 一 种 办 法 , 更 简单 , 注意 运用 “: : ”做 字段 分 隔 符号 。 你 可 以 用 一 般 字 符 串 的 stripC ::) X 
法 ， 得 到 全 部 字符 ， 然 后 用 stripC ) 得 到 你 要 找 的 三 个 整数 字段 。 我 们 现在 不 采用 这 种 方法 ， 
为 我 们 的 脚本 gendata. py 正 是 通过 这 种 方法 把 字符 组 合 到 一 起 的 。 














+- aa + 
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最 后 一 个 例子 : 假设 我 们 只 想 抽取 三 个 整数 字段 里 中 间 的 那个 整数 部 分 。 我 们 是 这 么 做 的 (用 搜 
索 ， 这 样 就 不 必 匹 配 整 个 字符 了 ) :“-Qd+)-”。 用 这 个 模式 “-(\d+)-”， 我 们 得 到 : 





M» patt = '-(1d9)-' 
2» m = re. search (patt, data) 






































>>> m. group)  £ entire match BEER HE 
'—-6- 
>>> m. group(1) # subgroup 1 Zl 
^6 
在 本 章 中 ， 有 很 多 正则 表达 式 的 强大 功能 我 们 未 能 涉及 ， 由 于 篇 幅 所 限 ， 我 们 无 法 详细 介绍 它 
们 。 但 我 们 希望 所 提供 的 信息 和 技巧 对 你 的 编程 实践 有 所 帮助 。 我 们 建议 你 参阅 有 关 文 档 以 获得 更 
多 在 Python 语言 中 使 用 正则 表达 式 的 知识 。 要 精通 正则 表达 式 ， 我 们 建议 你 阅读 Jeffrey E. F. 
Friedl 所 编写 的 Mastering Regular Expressions 一 书 。 
15.5 练习 
正则 表达 式 ， 根据 要 求 写 出 练习 15 -1 至 15- 12 相应 的 正则 表达 式 
15-1. 识别 下 列 字符 串 : “bat, ” “bit, ” “but, ” “hat, ” “hit, ” 或 “but” E 


15-2. 匹配 用 一 个 空格 分 隔 的 任意 一 对 单词 ， 比 如 ， 名 和 姓 。 


15-3. ”匹配 用 一 个 逗号 和 一 个 空格 分 开 的 一 个 单词 和 一 个 字母 。 例 如 ， 英 文人 名 中 的 姓 和 名 
的 首 字母 。 





15-4 匹配 所 有 合法 的 Python 标识 符 。 











15-5. ”请 根据 您 (读者 ) 本 地 关于 地 址 的 格式 写法 匹配 一 个 街道 地 址 (你 写 出 的 正则 表达 式 要 
尽 可 能 通用 以 匹配 任意 数目 的 表示 街道 名 字 的 单词 ， 包 括 类 型 指示 ) 。 比 如 ， 美 国 的 街道 地 址 使 用 这 
样 的 格式 ; 1180 Bordeaux Drive， 使 你 写 的 正则 表达 式 尽 可 能 通用 ， 要 求 能 够 匹配 多 个 单词 的 街道 
名 字 ， 如 : 3120 De la Cruz Boulevard. 














15-6. 匹配 简单 的 以 “www. ”开头 ， 以 “. com” 作 结尾 的 Web 域名， 例如: www. yahoo. com. ft 
加 题 : 使 你 写 的 正则 表达 式 还 支持 其 他 顶级 域名 : .edu, .net 等 ， 比 如 : www. ucsc. edu. 





15-7， 匹 配 全 体 Python 整数 的 字符 串 表 示 形 式 的 集合 。 


15 - 8， 匹 配 全 体 Python 长 整数 的 字符 串 表 示 形 式 的 集合 。 
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15-9. ME Python 浮 点 数 的 字符 串 表 示 形 式 的 集合 。 

















15-10. 匹配 全 体 Python 复数 的 字符 串 表 示 形 式 的 集合 。 








15 - 11， 匹 配 所 有 合法 的 电子 邮件 地 址 ( 先 写 出 一 个 限制 比较 宽松 的 正则 表达 式 ， 然 后 尽 可 能 加 
强 限 制 条 件 ， 但 要 保证 功能 的 正确 性 ) 。 
































15 - 12. 匹配 所 有 合法 的 Web 网 站 地 址 (URLs) ( 先 写 出 一 个 限制 比较 宽松 的 正则 表达 式 ， 然 后 尽 
可 能 加 强 限制 条 件 ， 但 要 保证 功能 的 正确 性 ) 。 


























15-13. type). type 0 内 建 函 数 返 回 一 个 对 象 类 型 ， 此 对 象 显示 为 Python 的 字符 串 形式 ， 
如 下 所 示 : 


2^» type (0) 
«type 'int'^ 
225» type (. 34) 
«type float’ > 
2252 type (dir) 





«type “builtin function or method’ > 
请 写 一 个 正则 表达 式 ， 能 从 这 个 字符 串 中 提取 出 类 型 的 名 字 。 你 的 函数 能 实现 以 下 功能 :如 
果 以 字符 串 “《type ' int’ >” 做 输入 , 会 返回 类 型 “int” (返回 其 他 类 型 也 同 理 , 如 , 返回 类 型 ‘float”， 
‘builtin function or _method” 等 ) 提示 : 正确 的 结果 保存 在 类 和 某 些 内 建 类 型 的 _name 属性 
里 。 















































15 - 14. 正则 表达 式 。 在 15. 2 小 节 里 ， 我 们 给 出 一 个 匹配 由 一 位 或 两 位 数字 代表 一 月 到 九 月 的 
字符 串 形式 (“09?[1-9]”) 。 请 写 出 一 个 正则 表达 式 表 示 标 准 日 历 上 其 它 的 三 个 月 (十 月 、 十 一 月 、 
十 二 月 ) 。 














15 - 15， 正 则 表达 式 。 在 15. 2 小 节 里 ,我 们 给 出 一 个 匹配 信用 卡 卡 号 的 模式 :(《 [079] (15, 16} ”). 
但 这 个 模式 不 允许 用 连 字 符号 分 制 信用 卡 卡 号 中 的 数字 。 请 写 出 一 个 允许 使 用 连 字符 的 正则 表达 式 ， 
但 要 求 连 字符 必须 出 现在 正确 的 位 置 。 例 如 ，15 位 的 信用 卡 卡号 的 格式 是 4-6-5, 表示 四 个 数字 ， 一 
个 连 字符 ， 后 面 接 六 个 数字 、 一 个 连 字符 ， 最 后 是 五 个 数字 。16 位 的 信用 卡 卡号 的 格式 是 4-4-4-4, 
数位 不 足 时 ， 添 0 补 位 。 附 加 题 : 有 一 个 用 于 确定 某 个 信用 卡 卡号 是 否 合法 的 算法 。 请 写 一 段 代码 ， 
它 不 但 能 识别 格式 正确 的 信用 卡 卡号 ， 还 能 验证 它 的 有 效 性 。 






















































































下 面 几 个 问题 (练习 15 - 16 到 15 - 27) 专 门 处 理 gendata. py 生成 的 数据 。 在 做 练习 15 - 17 和 
15-18 之 前 ， 请 先 把 练习 15 - 16 和 所 有 正则 表达 式 做 出 来 。 
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15-16. 修改 脚本 gendata. py 的 代码 ， 使 数据 直接 写 入 文件 redata. txt 中 ， 而 不 是 输出 到 屏 
幕 上 。 





15-17. 统计 生成 的 redata. txt 文件 中 ， 星 期 中 的 每 一 天 出 现 的 次 数 (或 统计 各 月 份 出 现 的 次 
数 ) 。 


15 - 18. 通过 检查 每 个 输出 行 中 整数 字段 部 分 的 第 一 个 整数 是 否 和 该 行 开头 的 时 间 惟 相 匹配 来 
验证 redata. txt 中 的 数据 是 否 完好 。 








根据 各 练习 的 要 求 写 出 相应 的 正则 表达 式 : 


15-19. ”提取 出 每 行 中 完整 的 时 间 玲 字段 。 
15-20. ”提取 出 每 行 中 完整 的 电子 邮件 地 址 。 

15-21. ”只 提取 出 时 间 蕉 字段 中 的 月 份 。 

15-22. 只 提取 出 时 间 愉 字段 中 的 年 份 。 

15-23. ”只 提取 出 时 间 蕉 字段 中 的 值 ( 格 式 ，HH:MM:SS) 。 

15-04. ”只 从 电子 邮件 地 址 中 提取 出 登录 名 和 域名 (包括 主 域名 和 顶级 域名 , 二 者 连 在 一 起 ) 。 

15-95. ”只 从 电子 邮件 地 址 中 提取 出 登录 名 和 域名 (包括 主 域名 和 顶级 域名 ， 二 者 分 别提 取 ) 。 
15-26. ”将 每 行 中 的 电子 邮件 地 址 替换 为 你 自己 的 电子 邮件 地 址 ， 

15-27. ”提取 出 时 间 截 中 的 月 、 日 、 年 ， 并 按照 格式 “月 日 ， 年 ”显示 出 来 ， 且 每 行 仅 遍 

















历 一 次 。 





我 们 在 小 节 15. 2 中 使 用 的 一 个 匹配 电话 号 码 的 正则 表达 式 ， 其 中 电话 号 码 允 许 包含 可 选 的 区 号 
前 级 : \d{3}-\d{3}-\d{4}. 请 在 练习 15- 28 和 15 -29 中 ， 修 改 这 个 正则 表达 式 ， 使 它 满足 : 








15 - 28. 区 号 (第 一 组 的 三 个 数字 和 它 后 面 的 连 字 符 ) 是 可 选 的 ， 即 ， 你 写 的 正则 表达 式 对 
800-555-1212 和 555-1212 都 可 以 匹配 。 








15-29. 区 号 中 可 以 包含 圆 括号 或 是 连 字符 ， 而 且 它们 是 可 选 的 ， 就 是 说 你 写 的 正则 表达 式 可 以 
匹配 800-555-1212， 或 555-1212， 或 (800) 555-1212. 
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引言 : 客户 /服务 器 架构 
套 接 字 : 通信 终点 

面向 连接 与 无 连接 套 接 字 
Python 中 的 网 络 编程 
Socket 模块 

套 接 字 对 象 方法 

TCP/IP 客户 端 和 服务 器 
UDP/IP 客户 端 和 服务 器 
SocketServer 模块 
Twisted 框架 介绍 

相关 模块 
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Chapter 1 6 


在 本 节 中 ， 我 们 将 简要 的 介绍 如 何 使 用 套 接 字 进 行 网 络 编程 。 首 先 ， 我 们 将 给 出 一 些 网 络 编程 
方面 的 背景 资料 和 Python 中 使 用 套 接 字 的 方法 ， 然 后 介绍 如 何 使 用 Python 的 一 些 模块 来 创建 网 络 
化 的 应 用 程序 。 














: 16.1 介绍 

16.1.1 什么 是 客户 / 服务 器 架构 ? 

什么 是 客户 / 服务 器 架构 ? 不 同 的 人 有 不 同 的 答案 。 这 要 看 你 问 的 是 什么 人 ， 以 及 指 的 是 软件 
系统 还 是 硬件 系统 了 。 但是， 有 一 点 是 共通 的 : 服务 器 是 一 个 软件 或 硬件 ， 用 于 提供 客户 需要 的 “ 服 
务 ”。 服 务 器 存在 的 唯一 目的 就 是 等 待 客户 的 请 求 ， 给 这 些 客户 服务 ， 然 后 再 等 竺 其它 的 请 求 。 

男 一 方面 ， 客 户 连 上 一 个 (预先 已 知 的 ) 服务 器 ， 提 出 自己 的 请 求 ， 发 送 必 要 的 数据 ， 然 后 就 
等 待 服务 器 的 完成 请 求 或 说 明 失 败 原 因 的 反馈 。 服 务 器 不 停 地 处 理 外 来 的 请 求 ， 而 客户 一 次 只 能 提 
出 一 个 服务 的 请 求 ， 等 待 结果 。 然 后 结束 这 个 事务 。 客 户 之 后 也 可 以 再 提出 其 它 的 请 求 ， 只 是 ， 这 









































个 请 求 会 被 视 为 男 一 个 不 同 的 事务 了 。 


£ The Internet 
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16-1 展示 了 如 今 最 常见 的 客户 / 服务 器 结构 。 一 个 用 户 或 客户 电脑 通过 Internet. 从 服务 器 
上 取 数 据 。 这 的 确 是 一 个 客户 / 服务 器 架构 的 系统 , 但 还 有 更 多 类 似 的 系统 满足 客户 / 服务 器 架构 。 
而 且 ， 客 户 / 服务 器 架构 也 可 以 应 用 到 电脑 硬件 上 。 





























硬件 的 客户 / 服务 器 架构 


打印 〈 机 ) 服务 是 一 个 硬件 服务 器 的 例子 。 它 们 处 理 打印 任务 ， 并 把 任务 发 给 相连 的 打印 机 《或 
其 它 打印 设备 )。 这 样 的 电脑 一 般 是 可 以 通过 网 络 访问 并 且 客 户 机 器 可 以 远程 发 送 打印 请 求 给 它 。 

另 一 个 硬件 服务 器 的 例子 是 文件 服务 器 。 它 们 一 般 拥 有 大 量 的 存储 空间 ， 客 户 可 以 远程 访问 。 

客户 机 器 可 以 把 服务 器 的 磁盘 映射 到 自己 本 地 ， 就 像 本 地 磁盘 一 样 使 用 它们 。 其 中 ， 
SunMicrosystems 公司 的 Network File System(NFS) 是 使 用 最 广泛 的 网 络 文件 系统 之 一 。 如 果 你 正 
在 访问 网 络 磁 盘 ， 并 且 区 分 不 出 是 本 地 的 还 是 网 络 上 的 ， 那 客户 / 服务 器 系统 就 很 好 的 完成 了 它们 
的 工作 。 其 目的 就 是 要 让 用 户 使 用 起 来 感觉 就 像 使 用 本 地 磁盘 一 样 。“ 抽 象 ” 到 一 般 的 磁盘 访问 这 一 
层 上 后 ， 所 有 的 操作 都 是 一 样 的 ， 而 让 所 有 操作 都 一 样 的 “实现 ” 则 要 依靠 各 自 的 程序 了 。 


























软件 客户 / 服务 器 架构 


软件 服务 器 也 是 运行 在 茶 个 硬件 上 的 。 但 不 像 硬 件 服务 器 那样 ， 有 专门 的 设备 ， 如 打印 机 ， 磁 
盘 等 。 软 件 服务 器 提供 的 服务 主要 是 程序 的 运行 ， 数 据 的 发 送 与 接收 ， 合 并 ， 升 级 或 其 它 的 程序 或 $ 























数据 的 操作 。 








如 今 ， 最 常用 的 软件 服务 器 是 Web 服务 器 。 一 台 机 器 里 放 一 些 网 页 或 Web 应 用 程序 ， 然 后 启动 
服务 。 这 样 的 服务 器 的 任务 就 是 接受 客户 的 请 求 ， 把 网 页 发 给 客户 (如 用 户 计算 机 上 的 浏览 器 )， 然 
后 等 待 下 一 个 客户 请 求 。 这 些 服 务 启动 后 的 目标 就 是 “永远 运行 下 去 ”。 虽然 它们 不 可 能 实现 这 样 的 
目标 ， 但 只 要 没有 关机 或 硬件 出 错 等 外 力 干扰 ， 它 们 就 能 运行 非常 长 的 一 段 时 间 。 






































数据 库 服 务 器 是 男 一 种 软件 服务 器 。 它 们 接受 客户 的 保存 或 读 取 请 求 ， 完 成 请 求 ， 然 后 再 等 待 
其 它 的 请 求 。 它 们 也 被 设计 为 要 能 “永远 ”运行 。 











我 们 要 讨论 的 最 后 一 种 软件 服务 器 是 窗口 服务 器 。 这 些 服务 器 几乎 可 以 认为 是 硬件 服务 器 。 它 
们 运行 于 一 个 有 显示 器 的 机 器 上 。 窗 口 的 客户 是 那些 在 运行 时 需要 窗口 环境 的 程序 ， 它 们 一 般 会 被 
叫做 图 形 界面 (GUI) 程序 。 在 一 个 DOS 窗口 或 Unix 的 shell 中 等 没有 窗口 服务 器 的 环境 中 ， 它 们 将 
无 法 启动 。 一 旦 窗口 服务 器 可 以 使 用 时 ， 那 一 切 就 正常 了 。 





























当世 界 有 了 网 络 ， 那 这 样 的 环境 就 开始 变 得 更 有 趣 了 。 一 般 情况 下 ， 窗 口 客户 的 显示 和 窗口 服 
务 器 的 提供 都 在 同一 台电 脑 上 。 但 在 X Window 之 类 的 网 络 化 的 窗口 环境 中 ， 你 可 以 选 

择 其 它 电脑 的 窗口 服务 器 来 做 显示 即 你 可 以 在 一 台电 脑 上 运行 GUI 程序 ， 而 在 另 一 台电 脑 上 显 
mE! 
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银行 出 纳 是 服务 器 ? 


理解 客户 / 服务 器 架构 的 一 个 方法 是 ， 想 像 一 个 不 吃 不 喝 ， 不 睡觉 的 银行 出 纳 ， 他 依次 回 排 成 
长 龙 的 顾客 们 提供 一 个 又 一 个 的 服务 (图 16-2)。 有 时 ， 队 伍 可 能 很 长 ， 有 时 ， 也 可 能 没 人 。 但 顾客 
随时 都 可 能 出 现 。 当 然 ， 在 以 前 ， 是 不 可 能 有 这 样 的 出 纳 的 。 但 现在 的 ATM 机 与 这 个 模型 很 像 。 


当然 ， 出 纳 就 是 一 个 运行 在 无 限 循 环 里 的 服务 器 。 每 一 个 顾客 就 是 一 个 想 要 得 到 服务 的 客户 。 
顾客 到 了 之 后 ， 就 按 先 来 先 服务 (FCFS〉 的 原则 得 到 服务 。 一 个 事务 结束 后 ， 客 户 就 离开 了 ， 而 服 
务 器 则 要 么 马上 为 下 一 个 顾客 服务 ， 要 么 坐 着 等 待 下 一 个 顾客 的 到 来 。 








为 什么 这 些 概念 那么 重要 ? 因为 ， 这 些 执行 的 方式 就 是 客户 / 服务 器 架构 的 特点 。 现 在 你 对 此 
己 经 有 了 大 体 的 认识 ， 我 们 就 可 以 把 客户 / 服务 器 架构 模型 应 用 到 网 络 编程 中 。 





16-2 在 此 图 中 的 银行 出 纳 “ 永 远 不 停 欣 ”地 为 客户 提供 服务 。 出 纳 运行 在 一 个 接收 请 求 ， 处 
理 请 求 然后 再 处 理 其 它 请 求 或 等 竺 其它 客 户 的 无 限 循环 中 。 客 户 有 可 能 已 经 排 起 了 长 龙 ， 也 有 可 能 
根本 就 没有 客户 。 但 是 ， 无 论 如 何 ， 服 务 器 都 不 会 结束 。 


16.1.2 客户 / 服务 器 网 络 编程 





在 完成 服务 之 前 ， 服 务 器 必需 要 先 完成 一 些 设置 动作 。 先 要 创建 一 个 通讯 端点 ， 让 服务 器 能 “ 监 
听 ” 请 求 。 你 可 以 把 我 们 的 服务 器 比 做 一 个 公司 的 接待 员 或 回答 公司 总 线 电 话 的 话务员 ， 一 旦 电话 
和 设备 安装 完成 ， 话 务 员 也 到 了 之 后 ， 服 务 就 可 以 开始 了 。 


IN 





aa + 
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在 网 络 世 界 里 ， 基 本 上 也 是 这 样 一 一 一 旦 通讯 端点 创建 好 之 后 ， 我 们 在 “监听 ”的 服务 器 就 可 
以 进入 它 那 等 待 和 处 理 客户 请 求 的 无 限 循环 中 了 。 当 然 ， 我 们 也 不 能 忘记 在 信纸 上 ， 杂 志 里 ， 广 千 
中 印 上 公司 的 电话 号 码 。 否 则 ， 就 没有 人 会 打 电 话 进来 了 ! 




















同样 地 ， 服 务 器 在 准备 好 之 后 ， 也 要 通知 潜在 的 客户 ， 让 它们 知道 服务 器 已 经 准备 好 处 理 服务 
了 。 人 和 否则 ， 没 有 人 会 提请 求 的 。 比 方 说 ， 你 建立 了 一 个 全 新 的 网 站 。 这 个 网 站 非常 的 出 色 ， 非 常 的 
吸引 人 ， 非 常 的 有 用 ， 是 所 有 网 站 中 最 酷 的 一 个 。 但 如 果 你 不 把 网 站 的 网 址 或 者 说 统一 资源 定位 符 
CURL) 广 而 告 之 的 话 ， 没 有 人 会 知道 这 个 网 站 的 存在 的 。 这 个 网 站 也 就 永远 不 见 天 日 了 。 对 于 公司 
总 部 的 新 电话 也 是 这 样 ， 你 不 把 电话 公之于众 ， 那 就 没有 人 会 打 电话 进来 。 





















































现在 ， 你 对 服务 器 如 何 工 作 已 经 有 了 一 个 很 好 的 认识 。 你 已 经 完成 了 最 难 的 那 一 部 分 。 客 户 端 
的 编程 相对 服务 器 端 来 说 就 简单 得 多 了 。 所 有 的 客户 只 要 创建 一 个 通讯 端点 , 建立 到 服务 器 的 连接 。 
然后 客户 就 可 以 提出 请 求 ， 请 求 中 ， 也 可 以 包含 必要 的 数据 交互 。 一 旦 请 求 处 理 完成 ， 客 户 收 到 了 
结果 ， 通 讯 就 结束 了 。 












































16.2 BRS: 通讯 端点 
16. 2. 1 什么 是 套 接 字 ? 














. 套 接 字 是 一 种 具有 之 前 所 说 的 “通讯 端点 ”概念 的 计算 机 网 络 数据 结构 。 网 络 化 的 应 用 程序 在 . 
开始 任何 通讯 之 前 都 必需 要 创建 套 接 字 。 就 像 电话 的 插口 一 样 ， 没 有 它 就 完全 没 办 法 通讯 。 








套 接 字 起 源 于 20 世纪 70 年 代 加 利 福 尼 亚 大 学 伯克利 分 校 版 本 的 Unix, 即 人 们 所 说 的 BSD Unix. 
因此 ， 有 时 人 们 也 把 套 接 字 称 为 “伯克利 套 接 字 ” 或 “BSD 套 接 字 ”。 一 开始 ， 套 接 字 被 设计 用 在 同 
一 台 主机 上 多 个 应 用 程序 之 间 的 通讯 。 这 也 被 称 进程 间 通讯 ， 或 IPC。 套 接 字 有 两 种 ， 分 别 是 基于 文 
件 型 的 和 基于 网 络 型 的 。 




















Unix 套 接 字 是 我 们 要 介绍 的 第 一 个 套 接 字 家 族 。 其 “家 族 名 ”为 AF_UNIX (在 POSIXI. g 标准 中 
也 叫 AF_LOCAL) ， 表 示 “ 地 址 家 族 : UNIX”。 包 括 Python 在 内 的 大 多 数 流行 平台 上 都 使 用 术语 “地 址 
家 族 ” 及 其 缩写 “AF”。 而 老 一 点 的 系统 中 ， 地址 家 族 被 称 为 “ 域 ”或 “协议 家 族 ”， 并 使 用 缩写 “PF” 
而 不 是 “AF”。 EPER, AF LOCAL (在 2000-2001 年 被 列 为 标准 ) 将 会 代替 AF_UNIX。 不 过 ， 为 了 向 后 
兼容 ， 很 多 系统 上 ， 两 者 是 等 价 的 。Python 自己 则 仍然 使 用 AF_UNIX。 








由 于 两 个 进程 都 运行 在 同一 台 机 器 上 ， 而 且 这 些 套 接 字 是 基于 文件 的 。 所以， 它们 的 底层 结构 
是 由 文件 系统 来 支持 的 。 这 样 做 相当 有 道理 ， 因 为 ， 同 一 台电 脑 上 ， 文 件 系 统 的 确 是 不 同 的 进程 都 
能 访问 的 。 












































男 一 种 套 接 字 是 基于 网 络 的 ， 它 有 自己 的 家 族 名 字 : AF_INET， 或 叫 “ 地 址 家 族 : Internet". 
还 有 一 种 地 址 家 族 AF_INET6 被 用 于 网 际 协议 第 6 版 (IPv6) 寻 址 上。 还 有 一 些 其 它 的 地 址 家 族 ， 不 
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过 ， 它 们 要 么 是 只 用 在 某 个 平台 上 ， 要 么 就 是 已 经 被 废弃 ， 或 是 很 少 被 使 用 ， 或 是 根本 就 还 没有 实 
现 。 所 有 地 址 家 族 中 ，AF_INET 是 使 用 最 广泛 的 一 个 。Python 2.5 中 加 入 了 一 种 Linux 套 接 字 的 支 
FF: AF NETLINK (无 连接 [ 见 下 ]) 套 接 字 家 族 让 用 户 代 码 与 内 核 代码 之 间 的 IPC 可 以 使 用 标准 BSD B 
接 字 接 口 。 而 且 ， 相 对 之 前 那些 往 操 作 系 统 中 加 入 新 的 系统 调用 ，proc 文件 系统 支持 或 是 “IO0CTL2? 
等 笨重 的 方案 来 说 ， 这 种 方法 显得 更 为 优美 ， 更 为 安全 。 
































Python 只 支持 AF_UNIX，AF_NETLINK， 和 AF INET 家 族 。 由 于 我 们 只 关心 网 络 编程 ， 所 以 在 本 
章 的 大 部 分 时 候 ， 我 们 都 只 用 AF_INET。 





16.2.2 套 接 字 地 址 ， 主机 与 端口 


如 果 把 套 接 字 比 做 电话 的 插口 一 一 即 通讯 的 最 底层 结构 ， 那 主机 与 端口 就 像 区 号 与 电话 号 码 的 
一 对 组 合 。 有 了 能 打 电 话 的 硬件 还 不 够 ,你 还 要 知道 你 要 打 给 谁 ， 往 哪 打 。 一 个 Internet 地 址 由 网 
络 通讯 所 必需 的 主机 与 端口 组 成 。 而 且 不 用 说 ， 男 一 端 一 定 要 有 人 在 听 才 可 以 。 否 则 ， 你 就 会 听 到 
熟悉 的 声音 “对 不 起 ， 您 拨 的 是 空 号 ， 请 查 对 后 再 播 >。 你 在 上 网 的 时 候 ， 可 能 也 见 过 类 似 的 情况 ， 
如 “不 能 连接 该 服务 器 。 服 务 器 无 响应 或 不 可 达 ”。 









































系统 ， 保 留 的 端口 号 (及 其 对 应 的 服务 / 协议 和 套 接 字 类 型 ) 可 以 通过 /etc/services 


合法 的 端口 号 范围 为 0 到 65535。 其 中 ， 小 于 1024 的 端口 号 为 系统 保留 端口 。 如 果 你 所 使 用 的 
是 Unix 操作 
文件 获得 。 常 用 端口 号 列表 可 以 从 下 面 这 个 网 站 获得 : 














http://www. iana. org/assignments/port-numbers 


16. 2. 3 面向 连接 与 无 连接 


面向 连接 





无 论 你 使 用 哪 一 种 地 址 家 族 。 套 接 字 的 类 型 只 有 两 种 。 一 种 是 面向 连接 的 套 接 字 ， 即 在 通讯 之 
前 一 定 要 建立 一 条 连接 ， 就 像 跟 朋友 打 电 话 时 那样 。 这 种 通讯 方式 也 被 称 为 “ 虚 电 路 ”或 “ 流 套 接 
字 ” 面向 连接 的 通讯 方式 提供 了 顺序 的 ， 可 靠 的 ， 不 会 重复 的 数据 传输 ， 而 且 也 不 会 被 加 上 数据 边 
界 。 这 也 意味 着 ， 个 要 发 送 的 信息 ， 可 能 会 被 拆 分 成 多 份 ， 每 一 份 都 会 不 多 不 少 地 正确 到 达 目 
的 地 。 然 后 被 重新 按 顺 序 拼装 起 来 ， 传 给 正在 等 待 的 应 用 程序 。 






























































实现 这 种 连接 的 主要 协议 就 是 传输 控制 协议 〈 即 TCP)。 要 创建 TCP 套 接 字 就 得 在 创建 的 时 候 ， 
指定 套 接 字 类 型 为 SOCK_STREAM。TCP 套 接 字 采用 SOCK_STREAM 这 个 名 字 ， 表 达 了 它 做 为 流 套 接 字 的 
特点 。 由 于 这 些 套 接 字 使 用 Internet 协议 CIP) 来 查找 网 络 中 的 主机 ， 这 样 形成 的 整个 系统 ， 一 般 
会 由 这 两 个 协议 (TCP 和 IP) KHER, BY TCP/IP. 
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无 连接 

















与 虚 电 路 完全 相反 的 是 数据 报 型 的 无 连接 套 接 字 。 这 意味 着 ， 无 需 建立 连接 就 可 以 进行 通讯 。 
但 这 时 ， 数 据 到 达 的 顺序 ， 可 靠 性 及 数据 不 重复 性 就 无 法 保证 了 。 数 据 报 会 保留 数据 边界 ， 这 就 表 
示 ， 数 据 不 会 像 面 向 连接 的 协议 那样 被 拆 分 成 小 块 。 

















使 用 数据 报 来 传输 数据 就 像 邮 政 服务 一 样 。 邮 件 和 包 囊 不 一 定 会 按 它们 发 送 的 顺序 到 达 。 事 实 
上 ， 它 们 还 有 可 能 根本 到 不 了 ! 而 且 ， 由 于 网 络 的 复杂 性 ， 数 据 还 可 能 被 重复 传送 。 








既然 数据 报 有 这 么 多 缺点 ， 为 什么 还 要 使 用 它 呢 ? 《一 定 有 什么 方面 能 胜 过 流 套 接 字 的 !) 由 于 
面向 连接 套 接 字 要 提供 一 些 保证 ， 以 及 要 维持 虚 电 路 连接 ， 这 都 是 很 重 的 额外 负担 。 数 据 报 没有 这 
些 负 担 ， 所 以 它 更 “便宜 ”。 通常 能 提供 更 好 的 性 能 ， 更 适合 某 些 应 用 场合 。 










































































实现 这 种 连接 的 主要 协议 就 是 用 户 数据 报 协 议 ( 即 UDP)。 要 创建 UDP 套 接 字 就 得 在 创建 的 时 候 ， 
指定 套 接 字 类 型 为 SOCK_DGRAM。SOCK_DGRAM 这 个 名 字 ， 也 许 你 已 经 猜 到 了 ,来 自 于 单词 “datagram” 
(“数据 报 ”)。 由 于 这 些 套 接 字 使 用 Internet 协议 来 查找 网 络 中 的 主机 ， 这 样 形 成 的 整个 系统 ， 一 
般 会 由 这 两 个 协议 (UDP 和 IP) 来 提 及 ， 即 UDP/IP. 


$ 16. 3 Python 中 的 网 络 编程 E 


现在 ， 你 已 经 有 了 足够 的 客户 / 服务 器 ， 套 接 字 和 网 络 方面 的 知识 。 我 们 现在 就 开始 把 这 些 概 
念 带 到 Python 中 来 。 本 节 中 ， 我 们 将 主要 使 用 socket 模块 。 模 块 中 的 socket O 函数 被 用 来 创建 套 
接 字 。 和 套 接 字 也 有 自己 的 一 套 函 数 来 提供 基于 套 接 字 的 网 络 通讯 。 























16. 3. 1 socket (模块 函数 








要 使 用 socket. socket O 函数 来 创建 套 接 字 。 其 语法 如 下 : 





socket (socket family, socket type, protocol-0) 


socket family FJ LA AF UNIX 或 AF INET. socket type 可 以 是 SOCK STREAM 或 SOCK DGRAM. 
这 几 个 常量 的 意义 可 以 参考 之 前 的 解释 。protocol 一 般 不 填 ， 默 认 值 为 0。 




















创建 一 个 TCP/IP 的 套 接 字 ， 你 要 这 样 调 用 socket. socket (): 


tcpSock = socket. socket (socket. AF INET, socket. SOCK STREAM) 
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同样 地 ， 创 建 一 个 UDP/IP 的 套 接 字 ， 你 要 这 样 : 
udpSock = socket. socket (socket. AF INET, socket. SOCK DGRAID 
由 于 socket 模块 中 有 太 多 的 属性 。 我 们 在 这 里 破例 使 用 了 ’ from module import * 语句 。 使 用 


"from socket import * ， 我 们 就 把 socket 模块 里 的 所 有 属性 都 带 到 我 们 的 命名 空间 里 了 ， 这 样 能 
大 幅 减 短 我 们 的 代码 。 











tcpSock = socket (AF INET, SOCK STREAM) 





当 我 们 创建 了 套 接 字 对 象 后 ， 所 有 的 交互 都 将 通过 对 该 套 接 字 对 象 的 方法 调用 进行 。 


16.3.2 套 接 字 对 象 (A) 方法 





表 16. 1 中 ， 我 们 列 出 了 最 常用 的 套 接 字 对 象 的 方法 。 在 下 一 个 小 节 中 ， 我 们 将 分 别 创建 TCP 和 
UDP 的 客户 和 服务 器 ， 它 们 都 要 用 到 这 些 方法 。 虽 然 我 们 只 关心 Internet 套 接 字 ， 但 是 这 些 方法 在 
Unix 套 接 字 中 的 也 有 类 似 的 意义 。 


表 16. 1 套 接 字 对 象 的 常用 函数 E 
函数 描述 






































服务 器 端 套 接 字 函 数 

s. bind () 绑 定 地 址 〈 主 机 ， 端 口号 对 ) 到 套 接 字 

s. listen 开始 TCP 监听 

s. accept () 被 动 接受 TCP RPA, (阻塞 式 ) 等 待 连接 的 到 来 
客户 端 套 接 字 函数 

s. connect () 主动 初始 化 TCP 服务 器 连接 

s.connect ex() connect () 函数 的 扩展 版 本 ， 出 错时 返回 出 错 码 ， 而 不 是 抛 异 常 
公共 用 途 的 套 接 字 函数 

s. recv () 接收 TCP 数据 

s. send () 发 送 TCP 数据 

s. sendall() 完整 发 送 TCP 数据 

s. recvfrom() 接收 UDP 数据 

s. Sendto () 发 送 UDP 数据 

s.getpeername() 连接 到 当前 套 接 字 的 远 问 的 地 址 

s. getsockname () 当前 套 接 字 的 地 址 

s.getsockopt () 返回 指定 套 接 字 的 参数 

s. setsockopt() 设置 指定 套 接 字 的 参数 

s. close() 关闭 套 接 字 
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Blocking-Oriented Socket Methods 
s.setblockingO 设置 套 接 字 的 阻塞 与 非 阻塞 模式 
s.settimeout O^ 设置 阻塞 套 接 字 操 作 的 超时 时 间 
s.gettimeout O^ 得 到 阻塞 套 接 字 操作 的 超时 时 间 
面向 文件 的 套 接 字 的 函数 

s. fileno() 套 接 字 的 文件 描述 符 

s. makefile() 创建 一 个 与 该 套 接 字 关 连 的 文件 

















a. Python 2. 3 版 本 新 加 入 的 函数 


核心 提示 : 在 运行 网 络 应 用 程序 时 ， 最 好 在 不 同 的 电脑 上 执行 服务 器 和 客户 端的 程序 。 

在 本 章 的 例子 中 ， 你 将 大 量 看 到 代码 和 输出 中 提 及 “1localhost” 主 机 和 127.0.0.1 IP 地 址 。 
我 们 的 例子 把 客户 与 服务 器 运行 在 同一 台电 脑 上 ， 我 们 建议 读者 改 掉 主 机 名 ， 并 把 代码 放 到 不 同 的 
电脑 上 运行 。 眼 见 着 自己 的 代码 在 不 同 的 电脑 上 进行 通讯 ， 这 一 时 刻 ， 你 更 能 体会 到 开发 的 乐趣 。 


16.3.3 创建 一 个 TCP 服务 器 





我 们 首先 将 给 出 一 个 关于 如 何 创建 一 个 通用 的 TCP 服务 器 的 伪 人 代码， 然后 解释 我 们 都 做 了 些 
什么 。 要 注意 的 是 ， 这 只 是 设计 服务 器 的 一 种 方法 ， 当 你 对 服务 器 的 设计 有 了 一 定 的 了 解 之 











后 ， 你 就 能 用 你 所 希望 的 方式 来 修改 这 段 伪 代 码 : 











ss = Socket() # 创建 服务 器 套 接 字 

ss. bind O # 把 地 址 绑 定 到 套 接 字 上 
ss. listen() # 监听 连接 

inf loop: # 服务 器 无 限 循 环 

cs 7 ss. accept () # 接受 客户 的 连接 

comm 1oop: # 通讯 循环 
cs.recv()/cs.send() # 对 话 ( 接 收 与 发 送 ) 

cs. close() # 关闭 客户 套 接 字 

ss. close() # 关闭 服务 器 套 接 字 〈 可 选 ) 











所 有 的 套 接 字 都 用 socket. socket O 函数 来 创建 。 服 务 器 需要 “ 坐 在 某 个 端口 上 ”等 待 请 求 。 所 
以 它们 必需 要 “ 绑 定 ” 到 一 个 本 地 的 地 址 上 。 由 于 TCP 是 一 个 面向 连接 的 通讯 系统 ， 在 TCP 服务 器 
可 以 开始 工作 之 前 ， 要 先 完 成 一 些 设 置 。TCP 服务 器 必需 要 “监听 ”( 进 来 的 ) 连接 ， 设 置 完 成 之 后 ， 
服务 器 就 可 以 进入 无 限 循环 了 。 



































一 个 简单 的 《单线 程 的 ) 服务 器 会 调用 accept O 函数 等 待 连接 的 到 来 。 默 认 情 况 下 ，accept 0 
函数 是 阻塞 式 的 ， 即 程序 在 连接 到 来 之 前 会 处 于 挂 起 状态 。 套 接 字 也 文 持 非 阻 塞 模式 。 请 参阅 相关 
文档 或 操作 系统 手册 以 了 解 为 何 及 如 何 使 用 非 阻塞 套 接 字 。 
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一 旦 接收 到 一 个 连接 ，accept O 函数 就 会 返回 一 个 单独 的 客户 的 套 接 字 用 于 后 续 的 通讯 。 使 用 
新 的 客户 套 接 字 就 像 把 客户 的 电话 转 给 一 个 客户 服务 人 员 。 当 一 个 客户 打 电 话 进来 的 时 候 ， 总 机 接 
了 电话 ， 然 后 把 电话 转 到 合适 的 人 那里 来 处 理 客户 的 需求 。 



































这 样 就 可 以 空 出 总 机 ， 也 就 是 最 初 的 那个 服务 器 人 套 接 字 ， 于 是 ， 话 务 员 束 可 以 等 待 下 一 个 电话 
《客户 的 请 求 )， 与 此 同时 ， 前 一 个 客户 与 对 应 的 客户 服务 人 员 在 男 一 条 线路 上 进行 着 他 们 自己 的 对 
话 。 同 样 的 ， 当 一 个 请 求 到 来 时 ， 要 创建 一 个 新 的 端口 ， 然 后 直接 在 那个 端口 上 与 客户 对 话 ， 这 样 
就 可 以 空 出 主 端口 来 接受 其 它 客 户 的 连接 。 




















核心 提示 : 创建 线程 来 处 理 客户 的 请 求 。 

我 们 不 打算 在 例子 实现 这 样 的 功能 。 但 是 ， 创 建 一 个 新 的 线程 或 进程 来 完成 与 客户 的 通讯 是 一 
种 非常 常用 的 手段 。 SocketServer 模块 是 一 个 基于 socket 模块 的 高 级 别 的 套 接 字 通讯 模块 , CME 
在 新 的 线程 或 进程 中 处 理 客户 的 请 求 。 建 议 读者 参阅 相关 文章 及 第 17 章 多 线程 编程 的 习题 ， 以 了 解 
更 多 的 信息 。 








在 临时 套 接 字 创 建 好 之 后 ， 通 讯 就 可 以 开始 了 。 客 户 与 服务 器 都 使 用 这 个 新 创建 的 套 接 字 进 行 
数据 的 发 送 与 接收 ， 直 到 通讯 的 菜 一 方 关闭 了 连接 或 发 送 了 一 个 空 字符 串 之 后 ， 通 讯 就 结束 了 。 

















在 代码 中 ， 当 客户 连接 关闭 后 ， 服 务 器 继续 等 待 下 一 个 客户 的 连接 。 代 码 的 最 后 一 行 ， 会 把 服 
务 器 的 套 接 字 关闭 。 由 于 服务 器 处 在 无 限 循 环 中 ， 不 可 能 会 走 到 这 一 步 ， 所 以 ， 这 一 步 是 可 选 的 。 
我 们 写 这 一 句 话 的 主要 目的 是 要 提醒 读者 ， 在 设计 一 个 更 智能 的 退出 方案 的 时 候 ， 比 方 说 ， 服 务 器 
被 通知 要 关闭 的 时 ， 要 确保 close O 函数 会 被 调用 。 



































在 例 16.1 tsTserv.py 文件 中 ， 会 创建 一 个 TCP 服务 器 程序 ， 这 个 程序 会 把 客户 发 送 过 来 的 字 
符 串 加 上 一 个 时 间 戳 《格式 :“[ 时 间 ] 数 据 " ) 返回 给 客户 。 








例 16. 1 TCP 时 间 惟 服务 器 (tsTserv. py) 














创建 一 个 能 接收 客户 的 消息 ， 在 消息 前 加 一 个 时 间 戳 后 返回 的 TCP 服务 器 。 


7 #!/usr/bin/env python 
2 

3 from socket import * 
4 from time import ctime 
5 

6 HOST = "* 

7 PORT = 21567 

8 BUFSIZ = 1024 

9 ADDR = (HOST, PORT) 
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10 

77 tepSerSock = socket (AF_INET, SOCK STREAM) 
12 tcpSerSock. bind (ADDR) 

13 tepSerSock. listen (5) 

14 

15 while True: 

16 print "waiting for connection...’ 

17 tepCliSock, addr = tcpSerSock. accept () 
18 print °... connected from:’, addr 

19 

20 while True: 

21 data = tcpCliSock. recv (BUFSIZ) 

22 if not data: 

28 break 

24 tcepCliSock. send C [fs] %s’ % ( 

25 ctime(), data)) 

26 

27 tcpCliSock. close () 

28 tcpSerSock. close () 














6-13 fT 

HOST 变量 为 空 ， 表 示 bind O 函数 可 以 绑 定 在 所 有 有 效 的 地 址 上 。 我 们 还 选用 了 一 个 随机 生成 的 
未 被 占用 的 端口 号 。 在 程序 中 ， 我 们 把 缓冲 的 大 小 设 定 为 IK。 你 可 以 根据 你 的 网 络 情况 和 应 用 的 需 
要 来 修改 这 个 大 小 。1listen O 函数 的 参数 只 是 表示 最 多 允许 多 少 个 连接 同时 连 进来 ， 后 来 的 连接 就 
会 被 拒绝 掉 。 



































TCP 服务 器 的 套 接 字 (tcpSerSock) 在 第 11 行 被 生成 。 随 后 把 套 接 字 绑 定 到 服务 器 的 地 址 上 ， 然 
后 开始 TCP 监听 。 


15-28 行 

在 进入 到 服务 器 的 无 限 循环 后 ， 我 们 (被 动 地 ) 等 待 连接 的 到 来 。 当 有 连接 时 ， 我 们 进入 对 话 循 
环 ， 等 待 客户 发 送 数据 。 如 果 消 息 为 室 ， 表 示 客 户 已 经 退出 ， 那 就 再 去 等 待 下 一 个 客户 的 连接 。 得 
到 客户 的 消息 后 ， 我 们 在 消息 前 加 一 个 时 间 惟 然后 返回 。 最 后 一 行 不 会 被 执行 到 ， 放 在 这 里 用 于 提 
醒 读 者 ， 在 服务 器 要 退出 的 时 候 ， 要 记得 调用 closeO 函数 。 
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16.3. 4 创建 TCP 客户 端 








创建 TCP 客户 端 相对 服务 器 来 说 更 为 容易 。 与 TCP 服务 器 那 段 类 似 ， 我 们 也 是 先 给 出 伪 代 码 及 
其 解释 ， 然 后 再 给 出 真正 的 代码 。 











cs = Socket () # 创建 客户 套 接 字 
cs. connect () # 尝试 连接 服务 器 
comm loop: # 通讯 循环 

cs. send()/cs. recvO.  & 对 话 〈 发 送 / 接收 ) 
cs. close () # 关闭 客户 套 接 字 





如 之 前 所 说 ， 所 有 的 套 接 字 都 由 socket. socket O 函数 创建 。 在 客户 有 了 和 套 接 字 之 后 ， 马 上 就 可 
以 调用 connect O 函数 去 连接 服务 器 。 连 接 建立 后 ， 就 可 以 与 服务 器 开始 对 话 了 。 在 对 话 结束 后 ， 客 
户 就 可 以 关闭 套 接 字 ， 结 束 连接 。 












































在 例 16.2 中 , 我 们 给 出 了 teTInt. py 的 代码 。 程 序 连 接 到 服务 器 , 提示 用 户 输入 要 传输 的 数据 ， 
然后 显示 服务 器 返回 的 加 了 时 间 戳 的 结果 。 


逐 行 解 释 
1-3 行 
第 1 行 是 Unix 的 启动 信息 行 ， 随 后 我 们 导入 了 socket 模块 的 所 有 属性 。 


例 16.2 TCP 时 间 惟 客户 端 (tsTclnt. py) 











BE 








创建 一 个 TCP 客户 端 ， 程 序 会 提示 用 户 输入 要 传 给 服务 器 的 信息 ， 显 示 服 务 器 返回 的 加 了 
时 间 惟 的 结果 。 











7 #!/usr/bin/env python 

2 

3 from socket import * 

4 

5 HOST = localhost’ 

6 PORT = 21567 

7 BUFSIZ = 1024 

8 ADDR = (HOST, PORT) 

9 

10 tepCliSock = socket (AF_INET, SOCK STREAM) 
11 tepCliSock. connect (ADDR) 
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13 while True: 

14 data = raw input( °) 
15 if not data: 

16 break 

17 tcpCliSock. send (data) 
18 data = tcpCliSock. recv (BUFSIZ) 
19 if not data: 

20 break 

21 print data 

22 

23 tepCliSock. close () 


5-11 íF 





HOST 和 PORT 变量 表示 服务 器 的 主机 名 与 端口 号 。 由 于 我 们 在 同一 台电 脑 上 进行 测试 , 所 以 HOST 











里 放 的 是 本 机 的 主机 名 《如 果 你 的 服务 器 运行 在 其 它 电脑 上 ， 要 做 相应 的 修改 )。 端 口号 要 与 服务 器 
上 的 设置 完全 相同 〈 不 然 就 没 办 法 通讯 了 )。 缓 冲 区 的 大 小 还 是 设 为 1K. 


t. 








Tp We? 很 显然 ， 如 果 我 们 先 运 行 客 户 ， 由 于 没有 服务 器 在 等 





TCP 客户 套 接 字 (tcpCliSock) 在 第 10 行 创 建 。 然 后 就 去 连接 服务 器 。 


13-23 行 





客户 端 也 有 一 个 无 限 循 环 ， 但 这 跟 服 务 器 的 那个 不 期 望 退 出 的 无 限 循环 不 一 样 。 客 户 端的 循环 
以 下 两 个 条 件 的 任意 一 个 发 生 后 就 退出 : 用 户 没 有 输入 任何 内 容 〈14-16 行 )， 或 服务 器 由 于 某 种 











16. 3. 5 运行 我 们 的 客户 端 与 服务 器 程序 








原因 退出 ， 导 致 recv () 函数 失败 (18-20 行 )。 否 则 ， 在 一 般 情 况 下 ， 客 户 端 会 把 用 户 输入 的 字符 囊 
发 给 服务 器 进行 处 理 ， 然 后 接收 并 显示 服务 器 传 回来 的 ， 加 了 时 间 戳 的 字符 串 。 








现在 ， 我 们 来 运行 服务 器 和 客户 程序 ， 看 看 它们 的 运行 情况 如 何 。 我 们 应 该 先 运行 服务 器 还 是 




















竺 请求， 客户 没 办 法 做 连接 。 服 务 器 














是 一 个 被 动 端 ， 它 先 创建 自己 然后 被 动 地 等 竺 连接。 而 客户 则 是 主动 端 ， 由 它 主动 地 建立 一 个 连接 。 
所 以 : 要 先 开 服 务 器 ， 后 开 客 户 。 














我 们 在 运行 客户 和 服务 器 的 例子 中 ， 使 用 了 同一 台电 脑 。 其 实 也 可 以 把 服务 器 放 在 其 它 的 电脑 
上 ， 这 时 ， 只 要 改 改 主 机 名 就 好 了 。( 看 到 自己 写 的 第 一 个 网 络 程序 运行 在 不 同 的 电脑 上 ， 那 是 多 么 
激动 人 心 的 事 啊 )。 




















下 面 就 是 客户 端的 输入 与 输出 ， 不 输入 数据 ， 直 接 按 回 车 键 就 可 以 退出 程序 : 


$ tsTclnt. py 
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> hi 

[Sat Jun 17 17:27:21 2006] hi 

> spanish inquisition 

[Sat Jun 17 17:27:37 2006] spanish inquisition 
> 

$ 








服务 器 的 输出 主要 用 于 调试 目的 : 


$ tsTserv. py 
waiting for connection... 
... connected from: (127.0.0.1°, 1040) 


waiting for connection... 








当 有 客户 连接 上 来 的 时 候 ， 会 显示 一 个 “.. .connected from ... ”信息 。 在 客户 接受 服务 的 
时 候 ， 服 务 器 义 回 去 等 待 其 它 客户 的 连接 。 在 从 服务 器 退出 的 时 候 ， 我 们 要 跳出 那个 无 限 循 环 ， 这 
时 会 触发 一 个 异常 。 避 免 这 种 错误 的 方法 是 采用 一 种 更 优美 的 退出 方式 。 




















核心 提示 : 优美 的 退出 和 调用 服务 器 的 close 0 函数 
$ “友好 地 ”退出 的 一 个 方法 就 是 把 服务 器 的 无 限 循环 放 在 一 个 try-except 语句 的 try 子 句 当 $ 
中 ， 并 捕获 EOFError 和 KeyboardInterrupt 异常 。 在 异常 处 理子 句 中 , 调用 close O 函数 关闭 服务 
器 的 套 接 字 。 


这 个 简单 的 网 络 应 用 程序 的 有 趣 之 处 并 不 仅仅 在 于 我 们 演示 了 数据 怎样 从 客户 传 到 服务 器 ， 然 
后 又 传 回 给 客户 ， 而 且 我 们 还 把 这 个 服务 器 当成 了 “时 间 服 务 器 ”， 因 为 ， 字 符 串 中 的 时 间 戳 完全 是 
来 自 于 服务 器 的 。 





16. 3. 6 创建 一 个 UDP 服务 器 


由 于 UDP 服务 器 不 是 面向 连接 的 ， 所 以 不 用 像 TCP 服务 器 那样 做 那么 多 设置 工作 。 事 实 上 ， 并 
不 用 设置 什么 东西 ， 直 接 等 竺 进来 的 连接 就 好 了 。 

















ss = Socket() # 创建 一 个 服务 器 套 接 字 
ss. bind O # 绑 定 服务 器 套 接 字 
inf loop: # 服务 器 无 限 循 环 

cs = ss.recvfrom()/ss.sendto() # 对 话 ( 接 收 与 发 送 ) 
ss. close () # 关闭 服务 器 套 接 字 








从 伪 代 码 中 可 以 看 出 ， 使 用 的 还 是 那 套 先 创建 套 接 字 然后 绑 定 到 本 地 地 址 (主机 / 端口 对 ) 的 
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同样 的 ， 由 于 代码 不 会 跳出 无 限 循 环 ， 所 以 ，close 0 函数 调用 是 可 选 的 。 我 们 写 这 一 句 话 的 原因 是 
要 提醒 读者 ， 在 设计 一 个 更 智能 的 退出 方案 的 时 候 ， 要 确保 close () 函数 会 被 调用 。 
































例 16. 3 UDP 时 间 惟 服务 器 (tsUserv. py) 














创建 一 个 能 接收 客户 的 消息 ， 在 消息 前 加 一 个 时 间 惟 后 返回 的 UDP 服务 器 。 


7 #!/usr/bin/env python 
2 
3 from socket import * 
4 from time import ctime 
5 
6 HOST = 一 
7 PORT = 21567 
8 BUFSIZ = 1024 
9 ADDR = (HOST, PORT) 
10 
11 udpSerSock = socket(AF INET, SOCK DGRAM 
12 udpSerSock. bind (ADDR) 
13 
14 while True: 
15 print ‘waiting for message...” 
16 data, addr = udpSerSock. recvfrom(BUFSIZ) 
17 udpSerSock. sendto( [%s] %s’ % ( 
18 ctime(), data), addr) 
19 print °... received from and returned to:’, addr 
20 
21 udpSerSock. close () 








UDP 和 TCP 服务 器 的 男 一 个 重要 的 区 别 是 ， 由 于 数据 报 套 接 字 是 无 连接 的 ， 所 以 无 法 把 客户 的 连 
接 交 给 另外 的 套 接 字 进 行 后 续 的 通讯 。 这 些 服务 器 只 是 接受 消息 ， 需 要 的 话 ， 给 客户 返回 一 个 结果 
就 可 以 了 。 




















例 16.3 的 tsUserv. py 是 之 前 那个 TCP 服务 器 的 UDP 版 本 ， 它 接收 客户 的 消息 ， 加 时 间 惟 后 返 
回 给 客户 。 





逐 行 解 释 
1-4 f 
就 像 TCP 服务 器 的 设置 那样 , 在 Unix 的 启动 信息 行 后 , 我 们 导入 了 time. ctime (函数 和 socket 


$— 一 * 一 
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模块 的 所 有 属性 。 


6-12 行 

HOST 和 PORT 变量 与 之 前 完全 一 样 。socket O 函数 的 调用 有 一 些 不 同 ， 我 们 现在 要 的 是 一 个 数据 
报 /UDP 的 套 接 字 类 型 。 不 过 bind O 函数 还 是 跟 TCP 版 本 的 一 样 。 同 样 地 ， 由 于 UDP 是 无 连接 的 ， 就 
不 用 调用 listen O 函数 来 监听 进来 的 连接 了 。 











14-21 行 

在 进入 到 服务 器 的 无 限 循环 后 ， 我 们 (被 动 地 ) 等待 (数据 报 ) 消息 的 到 来 。 当 有 消息 进来 时 ， 就 
处 理 它 (在 前 面 加 时 间 惟 ), 把 结果 返回 回去 , 然后 再 去 等 等 下 一 个 消息 。 就 像 之 前 一 样 , 那个 closeO 
函数 只 是 一 个 演示 而 已 。 














16. 3.7 创建 一 个 UDP 2x 3m 


这 一 节 中 介绍 的 4 上段 程序 中 ， 下 面 的 这 段 UDP 客户 的 代码 是 最 短 的 。 伪 代码 如 下 : 





cs = socket () # 创建 客户 套 接 字 
comm loop: # 通讯 循环 


cs. sendto()/cs. recvfrom() # 对 话 (AIK / 接收 ) 
cs. close () # 关闭 客户 套 接 字 


在 套 接 字 对 象 创建 好 之 后 ， 我 们 就 进入 一 个 与 服务 器 的 对 话 循环 。 在 通讯 结束 后 ， 套 接 字 就 被 
关闭 了 。tsUclnt. py 真实 的 代码 在 例 16. 4 中 给 出 。 





还 是 跟 TCP 版 本 的 客户 一 样 ， 在 Unix 的 启动 信息 行 后 ， 我 们 导入 了 socket 模块 的 所 有 属性 。 








5-10 行 
因为 我 们 的 服务 器 也 是 运行 在 本 机 ， 我 们 的 客户 还 是 使 用 本 机 和 相同 的 端口 号 。 自 然 地 ， 绥 冲 
的 大 小 也 还 是 1K。 创 建 套 接 字 的 方法 跟 UDP 服务 器 中 的 一 样 。 





12-22 行 

UDP 客户 的 循环 基本 上 与 TCP 客户 的 完全 一 样 。 唯 一 的 区 别 就 是 ,我 们 不 用 先 去 跟 UDP 服务 器 建 
立 连 接 ， 而 是 直接 把 消息 发 送出 去 ， 然 后 等 待 服务 器 的 回复 。 得 到 加 了 时 间 戳 的 字符 串 后 ， 把 它 显 
示 到 屏幕 上 ， 然 后 再 继续 其 它 的 消息 。 在 输入 结束 后 ， 退 出 循环 ， 关 闭 套 接 字 。 














例 16. 4 UDP 时 间 惟 客户 (tsUcInt. py) 
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创建 一 个 UDP 客户 端 ， 程 序 会 提示 用 户 输入 要 传 给 服务 器 的 信息 ， 显 示 服务 器 返回 的 加 了 时 间 
BRIAR 














7 #l/usr/bin/env python 

2 

3 from socket import * 

4 

5 HOST = localhost’ 

6 PORT = 21567 

7 BUFSIZ = 1024 

8 ADDR = (HOST, PORT) 

9 

10 udpCliSock = socket(AF INET, SOCK DGRAMD 

Il 

12 while True: 

13 data = raw input C °) 

14 if not data: 

15 break 
16 udpCliSock. sendto (data, ADDR) 
17 data, ADDR = udpCliSock. recvfrom(BUFSIZ) 
18 if not data: 
19 break 

20 print dataudpCliSock. close () 

21 

22 udpCliSock. close () 


16. 3. 8 执行 UDP 服务 器 和 客户 端 





UDP 客户 与 TCP 客户 的 表现 类 似 : 


$ tsÜUcint. py 

> hi 

[Sat Jun 17 19:55:36 2006] hi 

> spam! spam! spam! 

[Sat Jun 17 19:55:40 2006] spam! spam! spam! 
> 

$ 


服务 器 也 差不多 : 
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$ tsUserv. py 





waiting for message... 
... received from and returned to: (127.0.0.1°, 1025) 
walting for message... 








我 们 输出 客户 信息 的 原因 是 ， 服 务 器 可 能 会 得 到 并 回复 多 个 客户 的 消息 ， 这 时 ， 输 出 就 可 以 让 
我 们 了 解 消息 来 自 哪里 。 对 于 TCP 服务 器 来 说 ， 由 于 客户 会 创建 一 个 连接 ， 我 们 自然 就 能 知道 消息 
来 自 哪 里 。 注 意 ， 我 们 的 提示 信息 写 的 是 “waiting for message”(“ 等 待 消 息 ”) MA “waiting 
for connection”(“ 等 待 连接 ”) 。 

















16. 3.9 套 接 字模 块 属 性 








除了 我 们 已 经 很 熟悉 的 socket. socket () 函数 之 外 ，socket 模块 还 有 很 多 属性 可 供 网 络 应 用 程 
序 使 用 。 表 16. 2 中 列 出 了 最 常用 的 几 个 。 





请 参考 Python 手册 中 socket 模块 的 文档 以 了 解 更 多 的 信息 。 


表 16. 2 socket 模块 属性 
属性 名 字 描述 





















































数据 属性 

AF_UNIX，AF_INET，AF_INET6* — Python 支持 的 套 接 字 家 族 

SO STREAM, SO DGRAM 套 接 字 类 型 (TCP = Hit, UDP = 数据 报 ) 

has ipv6' 表示 是 否 文 持 IPv6 的 标志 变量 

A 

error 套 接 字 相 关 错 误 

herror 主机 和 地 址 相关 的 错误 

gaierror' 地 址 相关 的 错误 

timeout 超时 

socket () 用 指定 的 地 址 家 族 ， 套 接 字 类 型 和 协议 类 型 E) 创建 一 个 套 接 字 对 象 
socketpair () ° 用 指定 的 地 址 家 族 ， 套 接 字 类 型 和 协议 类 型 (可 选 ) 创建 一 对 套 接 字 对 象 
fromfd () 用 一 个 已 经 打开 的 文件 描述 符 创 建 一 个 套 接 字 对 象 

数据 属性 

ssl ()* 在 套 接 字 初始 化 一 个 安全 套 接 字 层 (SSL) 。 不 做 证 书 验证 。 
getaddrinfo (0° 得 到 地 址 信息 

getfqdn()* 返回 完整 的 域 的 名 字 

gethostname () 得 到 当前 主机 名 














Edit By Vheavens 


Edit By Vheavens 


ee 
T 

















gethostbyname () 由 主机 名 得 到 对 应 的 ip 地 址 

gethostbyname ex() gethostbyname O 的 扩展 版 本 ， 返 回 主机 名 ， 主 机 所 有 的 别名 和 
IP 地 址 列表 。 

gethostbyaddr () 由 IP 地 址 得 到 DNS 信息 ， 返 回 一 个 类 似 gethostbyname_ex () 

的 3 元 组 。 

getprotobyname () HHE Cl tcp’) 得 到 对 应 的 号 码 。 

getservbyname () / 由 服务 名 得 到 对 应 的 端口 号 或 相反 

getservbyport () 两 个 函数 中 ， 协 议 名 都 是 可 选 的 。 

ntohl () /ntohs () 把 一 个 整数 由 网 络 字 节 序 转 为 主机 字 节 序 

htonl © /htons © 把 一 个 整数 由 主机 字 节 序 转 为 网 络 字 节 序 

inet_aton() / 把 IP 地 址 转 为 32 MRA, WAR ceu eR. LXT IP v4 地 址 有 效 ) 

inet ntoa() 

inet pton( / 把 IP 地 址 转 为 二 进 制 格式 以 及 反 向 函数 。( 仅 对 IPv4 地 址 有 效 ) 


inet ntop()' 
getdefaulttimeout () / 得 到 / 设置 默认 的 套 接 字 超 时 时 间 ， 单 位 秒 〈 浮 点 数 ) 
setdefaulttimeout Q” 








a. Python 2.2 新 增 . 
. Python 2.3 新 增 . 
. Python 2.4 新 增 . 
. Python 1.6 新 增 . 
. Python 2.0 新 增 . 
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16. 4 *SocketServer 模块 


SocketServer 是 标准 库 中 一 个 高 级 别 的 模块 。 用 于 简化 网 络 客户 与 服务 器 的 实现 。 模 块 中 ， 
己 经 实现 了 一 些 可 供 使 用 的 类 。 


表 16. 3 SocketServer 模块 的 类 





类 描述 

BaseServer 包含 服务 器 的 核心 功能 与 混合 (mix-in) 类 的 钧 子 功能 。 这 个 类 用 于 
派生 ， 不 要 直接 生成 
这 个 类 的 类 对 象 ， 可 以 考虑 使 用 TCPServer 和 UDPServer。 

















TCPServer/ 基本 的 网 络 同步 TCP/UDP 服务 器 
UDPServer 

UnixStreamServer/ 基本 的 基于 文件 同步 TCP/UDP HRS at 
UnixDatagramServer 
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ForkingMixIn/ 实现 了 核心 的 进程 化 或 线程 化 的 功能 ， 用 于 与 服务 器 类 进行 混合 
(mix-in) ， 以 提供 一 些 异步 特性 。 

ThreadingMixIn 不 要 直接 生成 这 个 类 的 对 象 

ForkingTCPServer/ ForkingMixIn 和 TCPServer/UDPServer 的 组 合 

ForkingUDPServer 

ThreadingTCPServer/ ThreadingMixIn 和 TCPServer/UDPServer 的 组 合 

ThreadingUDPServer 

BaseRequestHandler 包含 处 理 服务 请 求 的 核心 功能 。 只 用 于 派生 新 的 类 ， 不 要 直接 生成 
这 个 类 的 对 象 ， 


可 以 考虑 使 用 StreamRequestHandler 或 DatagramRequestHandler 
StreamRequestHandler/ TCP/UDP 服务 器 的 请 求 处 理 类 的 一 个 实现 
DatagramRequestHandler 




















我 们 将 再 次 实现 之 前 的 那个 基本 TCP 的 例子 。 你 会 注意 到 新 实现 与 之 前 有 很 多 相似 之 处 ， 但 你 
也 要 注意 到 ， 现 在 很 多 繁杂 的 事情 已 经 被 封装 好 了 ， 你 不 用 再 去 关心 那个 样板 代码 了 。 例 子 给 出 的 
是 一 个 最 简单 的 同步 服务 器 。 记 得 要 看 看 本 章 最 后 的 把 服务 器 改 成 异步 的 练习 题 。 
































为 了 要 隐藏 实现 的 细节 。 我 们 现在 写 程 序 时 会 使 用 类 ， 这 是 与 之 前 代码 的 另 一 个 不 同 。 用 面 辣 
对 象 的 方法 可 以 帮助 我 们 更 好 的 组 织 数 据 与 逻辑 功能 。 你 也 会 注意 到 ， 我 们 的 程序 现在 是 “事件 驱 
动 ” 了 。 这 就 意味 着 ， 只 有 在 事件 出 现 的 时 候 ， 程 序 才 有 “反应 ”。 

















事件 包含 发 送 与 接收 数据 两 种 。 事 实 上 ， 你 会 看 到 ， 我 们 的 类 定义 中 只 包含 了 接收 客户 消息 的 
事件 处 理 器 。 其 它 的 功能 从 我 们 所 使 用 的 SocketServer 继承 而 来 。 界 面 编程 〈 第 18 章 ) 也 是 事件 
驱动 的 。 你 会 注意 到 有 一 个 相似 之 处 ， 即 在 代码 的 最 后 一 行 都 有 一 个 服务 器 的 无 限 循 环 ， 等 待 并 处 
理 客户 的 服务 请 求 。 本 章 之 前 创建 的 基本 TCP 服务 器 也 有 一 个 类 似 的 无 限 while 循环 。 












































在 之 前 的 服务 循环 中 , 我 们 阻塞 等 待 请 求 ， 有 请 求 来 的 时 候 就 处 理 请 求 ， 然 后 再 回去 继续 等 待 。 
现在 的 服务 循环 中 ， 就 不 用 在 服务 器 里 写 代 码 了 ， 改 成 定义 一 个 处 理 器 ， 服 务 器 在 收 到 进来 的 请 求 
的 时 候 ， 可 以 调用 你 的 处 理 函 数 。 
































16.4.1 创建 一 个 SocketServerTCP 服务 器 





在 代码 中 ， 先 导入 我 们 的 服务 器 类 ， 然 后 像 之 前 一 样 定义 主机 常量 。 主 机 常量 后 就 是 我 们 的 请 
求 处 理 器 类 ， 然 后 是 启动 代码 。 在 下 面 的 代码 片断 中 可 以 看 到 更 多 细节 。 














逐 行 解释 

1-9 fT 

最 开始 的 部 分 是 从 SocketServer 导入 需要 的 类 。 注 意 ， 我 们 在 使 用 Python2. 4 的 多 行 导 入 的 方 
式 。 如 果 你 使 用 老 版 本 的 Python， 那 么 你 要 使 用 模块 的 形 如 module. attribute 的 名 字 。 或 者 在 导入 
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的 时 候 ， 把 代码 写 在 同一 行 里 : 


from SocketServer import TCPServer as TCP, StreamRequestHandler as SRH 





例 16. 5 SocketServer 时 间 惟 服务 器 (tsTservSS. py) 





使 用 SocketServer 里 的 TCPServer 和 StreamRequestHandler 类 创建 一 个 时 间 惟 TCP 服务 器 。 


Ifg!/usr/bin/env python 

2 

3from SocketServer import (TCPServer as TCP, 
4StreamkequestHandler as SRH) 

from time import ctime 

6 

7HOST = 一 

SPORT = 21567 

9ADDR = (HOST, PORT) 

10 

li class MyRequestHandler (SRH) : 

12 def handle(self): 

13 print '...connected from:', self.client address 
14 self. wfile.write( [fis] fis" % (ctime Q, 
15 self. rfile. readline 0)) 

16 

17 tcepServ = TCP(ADDR, MyRequestHandler) 
18 print 'waiting for connection...’ 


19 tcpServ. serve forever () 


11-15 fT 
主要 的 工作 在 这 里 。 我 们 从 SocketServer 的 StreamRequestHandler 类 中 派生 出 一 个 子 类 ， 并 
重 写 handle () 函数。 在 BaseRequest 类 中 ， 这 个 函数 什么 也 不 做 : 





def handle(self): 


pass 


在 有 客户 消息 进来 的 时 候 ，handle O 函数 就 会 被 调用 。StreamRequestHandler 类 支持 像 操 作文 
件 对 象 那样 操作 输入 输出 套 接 字 。 我 们 可 以 用 readline O 函数 得 到 客户 消息 ， 用 write (0 函数 把 字 
符 串 发 给 客户 。 


E 








为 了 保持 一 致 性 ， 我 们 要 在 客户 与 服务 器 两 端的 代码 里 都 加 上 回 车 与 换行 。 实 际 上 ， 你 在 代码 
中 看 不 到 这 个 ,因为 ,我们 重用 了 客户 传 过 来 的 回 车 与 换行 。 除 了 这 些 我 们 刚刚 说 到 的 不 同 之 处 外 ， 











$— 一 * 一 
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代码 看 上 去 与 之 前 的 那个 服务 器 是 一 样 的 。 





17-19 行 
代码 的 最 后 部 分 用 给 定 的 主机 信息 和 请 求 处 理 类 创建 TCP 服务 器 。 然 后 进入 等 待 客户 请 求 与 处 
里 客户 请 求 的 无 限 循 环 中 。 























MH 





16.4.2 创建 SocketServerTCP 客户 端 








很 自然 地 ， 我 们 的 客户 端 与 之 前 的 客户 端的 代码 很 相似 ， 比 服务 器 相似 得 多 。 但 客户 端 要 做 一 
些 相应 地 调整 以 适应 新 的 服务 器 。 





逐 行 解释 
1-8 47 
没什么 特别 的 ， 与 原来 的 客户 端 完 全 相同 。 








例 16. 6 SocketServer 时 间 惟 TCP 客户 端 (tsTclntSS. py) 


这 是 一 个 时 间 惟 TCP 客户 端 ， 它 知道 如 何 与 SocketServer 里 StreamRequestHandler 对 象 进行 
通讯 。 


7 #!//usr/bin/env python 

2 

3 from socket import * 

4 

5 HOST = localhost’ 

6 PORT = 21567 

7 BUFSIZ = 1024 

8 ADDR = (HOST, PORT) 

9 

10 while True: 

11 tepCliSock = socket(AF INET, SOCK STREAM) 
12 tepCliSock. connect (ADDR) 

13 data = raw iInput( °) 

14 if not data: 

15 break 

16 tcpCliSock. send ( %s\r\n’ % data) 
17 data = tcpCliSock. recv (BUFSIZ) 
18 if not data: 

19 break 





$— 一 * 一 
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20 print data. strip 0 | 
21 tcpCliSock. close () 





10-21 fT 
SocketServer 的 请 求 处 理 器 的 默认 行为 是 接受 连接 ， 得 到 请 求 ， 然 后 就 关闭 连接 。 这 使 得 我 们 
不 能 在 程序 的 运行 时 ， 一 直 保 持 连 接 状 态 ， 要 每 次 发 送 数据 到 服务 器 的 时 候 都 要 创建 一 个 新 的 套 接 


























这 种 行为 使 得 TCP 服务 器 的 行为 有 些 像 UDP 服务 器 。 不 过 ， 这 种 行为 也 可 以 通过 重 写 请 求 处 理 
器 中 相应 的 函数 来 改变 。 我 们 把 这 个 留 在 本 章 最 后 的 练习 中 。 











现在 ， 我 们 的 客户 端 有 点 完全 不 一 样 了 《我 们 得 每 次 都 创建 一 个 连接 )。 其 它 的 小 区 别 在 服务 器 
代码 的 逐 行 解释 中 已经 看 到 了 : 我 们 使 用 的 处 理 器 类 像 文件 一 样 操作 套 接 字 ， 所 以 我 们 每 次 都 要 发 
送行 结束 字符 《〈 回 车 与 换行 )。 服 务 器 只 是 保留 时 并 重用 我 们 发 送 的 行 结束 字符 。 当 我 们 从 服务 器 得 到 
数据 的 时 候 ， 我 们 使 用 strip O 函数 去 掉 它们 ， 然 后 使 用 print 语句 提供 的 回 车 。 


















































16.4.2 执行 TCP 服务 器 和 客户 端 


下 面 是 我 们 SocketServer TCP 客户 端的 输出 : 


$ tsTcintSS. py 
> Tis but a scratch. 
[Tue Apr 18 20:55:49 2006] 'Tis but a scratch. 
^ Just a flesh wound. 
[Tue Apr 18 20:55:56 2006] Just a flesh wound. 


p 
$ 
下 面 是 服务 器 的 输出 : 


$ tsTservSS. py 
waiting for connection.. 

.connected from: (127 0.0. 1', 53476) 
..connected from: (127.0.0.1', 53477) 


输出 与 我 们 之 前 的 TCP 客户 与 服务 器 相似 。 不 过 ， 你 能 看 到 ， 我 们 连 了 服务 器 两 次 。 





16.5 Twisted 框架 介绍 
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Twisted 是 一 个 完全 事件 驱动 的 网 络 框架 。 它 允许 你 使 用 和 开发 完全 异步 的 网 络 应 用 程序 和 协议 。 
在 写本 书 的 时 候 ， 它 还 不 是 Python 标准 库 的 一 部 分 ， 要 使 用 它 ， 你 必需 另外 下 载 并 安装 它 《〈 在 本 章 
最 后 能 找到 链接 )。 它 为 你 创建 一 个 完整 系统 提供 了 很 大 的 帮助 。 系 统 中 可 以 有 : 网 络 协议 ， 线 程 ， 
安全 和 认证 ， 聊 天 /即时 通讯 ， 数 据 库 管 理 ， 关 系数 据 库 集成 ， 网 页 /互联 网 ， 电 子 邮件 ， 命 令 行 参 
数 ， 图 形 界面 集成 等 。 















































使 用 Twisted 来 实现 我 们 这 个 简单 的 例子 有 和 牛刀 字 鸡 的 感觉 。 不 过 ， 学 东西 总 要 有 切入 点 吧 ， 
我 们 先 实现 一 个 “Hello World” 的 网 络 应 用 程序 。 





4% SocketServer 一 样 ，Twisted 的 大 部 分 功能 都 在 它 的 类 里 面 。 在 我 们 的 例子 中 ， 我 们 将 使 用 
Twisted 的 Internet 组 件 中 reactor 和 protocol 包 的 类 。 


16. 5. 1 创建 一 个 Twisted Reactor TCP 服务 器 





你 会 发 现 我 们 的 代码 与 SocketServer 例子 有 些 相似 。 我 们 创建 一 个 协议 类 ， 并 像 安 装 回调 函数 
那样 重 写 几 个 函数 ， 而 不 是 写 一 个 处 理 嚣 类。 同样 的 ， 我 们 的 例子 是 异步 的 。 先 来 看 服务 器 : 























逐 行 解释 
1-6 行 
一 开始 的 代码 照常 是 模块 导入 部 分 。 要 注意 twisted. internet 中 protocol £I reactor 包 和 端 


口号 常量 。 








jw 
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我 们 从 Protocol 类 中 派生 出 TSServProtocol 类 做 为 时 间 惟 服务 器 。 然 后 重 写 connectionMade () 
函数 ， 这 个 函数 在 有 客户 连接 的 时 候 被 调用 ， 以 及 dataReceived() 函数 ， 这 个 函数 在 客户 通过 网 络 
发 送 数据 过 来 时 被 调用 。reactor 把 数据 当成 参数 传 到 这 个 函数 中 ， 这 样 我 们 就 不 用 自己 去 解析 数据 
ce 











例 16. 7 Twisted Reactor If la] #&% TCP 服务 器 (tsTservTW. py) 
这 是 一 个 使 用 Twisted Internet 类 的 时 间 惟 TCP 服务 器 


1#!/usr/bin/env python 

2 

3from twisted. internet import protocol, reactor 
4from time import ctime 

B 

6PORT = 21567 
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7 

8class TSServProtocol (protocol. Protocol): 

9def connectionMade (self) : 

10 cint = self. cint = self. transport. getPeer (). host 
ll print '...connected from:', cint 

12 def dataReceived(self, data): 

13 self. transport. write( [8s] “s? % ( 

14  ctime(, data)) 

15 

16 | factory = protocol. Factory O 





17 factory. protocol = TSServProtocol 
18 print 'waiting for connection...’ 
19 reactor. listenTCP (PORT, factory) 
20 reactor. run (Q 





我 们 通过 transport 对 象 与 客户 进行 通讯 。 你 可 以 看 到 在 connectionMade O 函数 中 ， 我 们 如 何 
得 到 主机 的 信息 ， 以 及 在 dataReceived O 函数 中 ， 我 们 如 何 把 数据 传 回 客户 端的 。 


16-20 行 

在 服务 器 的 最 后 一 部 分 ， 我 们 创建 一 个 protocol 工厂 。 它 被 称 为 “工厂 ”是 因为 ， 每 次 我 们 
有 连接 进来 的 时 候 ， 它 都 会 “生产 ”一 个 我 们 的 protocol 对 象 。 然 后 在 reactor 中 安装 一 个 TCP 
监听 器 以 等 待 服务 请 求 。 当 有 请 求 进来 时 ， 创 建 一 个 TSServProtocol 实例 来 服务 那个 客户 。 























16. 5.2 创建 一 个 Twisted Reactor TCP 客户 端 





与 SocketServer TCP 客户 不 一 样 的 是 ， 这 个 例子 与 之 前 的 客户 端 看 上 去 不 大 一 样 。 它 是 完 
Twisted 的 。 


例 16. 8 Twisted Reactor Timestamp TCP 客户 端 (tsTclntTW. py) 
FA Twisted 5RN CAA AYN TRI REX. TCP 客户 端 。 


7 #!/usr/bin/env python 

2 

3 from twisted. internet import protocol, reactor 
4 

5 HOST = localhost’ 

6 PORT = 21567 
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8 class TSCIntProtocol (protocol. Protocol): 
9 def sendData (self): 

10 data = raw input( ^ ’) 

ll if data: 

12 print '...sending fís...' % data 





13 self. transport. write (data) 

14 else: 

15 self. transport. loseConnect ion () 

16 

17 def connectionMade (self): 

18 self. sendData 0) 

19 

20 def dataReceived(self, data): 

21 print data 

22 self. sendData () 

23 

24 class TSCIntFactory (protocol. ClientFactory): 

25 protocol = TSCIntProtocol 
26 clientConnectionLost = clientConnectionFailed = | 
27 lambda self, connector, reason: reactor. stop () 
28 
29 reactor. connectTCP (HOST, PORT, TSCintFactory 0) 

30 reactor. run 


逐 行 解释 


1-6 行 
跟 之 前 所 有 的 客户 端 程序 类 似 ， 这 里 还 是 导入 Twisted 的 组 件 。 
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与 服务 器 一 样 ， 我 们 扩展 Protocol， 重 写 同样 的 函数 connectionMade () 和 dataReceived(). iX 
两 个 函数 的 用 途 也 跟 服 务 器 一 样 。 我 们 新 加 一 个 自己 的 函数 sendData()， 用 于 在 需要 发 送 数 据 时 调 
用 。 











由 于 我 们 现在 是 客户 ， 所 以 我 们 要 主动 初始 化 跟 服务 器 的 对 话 。 一 旦 连接 建立 好 之 后 ， 我 们 先 
发 送 一 个 消息 ， 服 务 器 回复 这 个 消息 ， 我 们 把 收 到 的 回复 显示 在 屏幕 上 ， 然 后 再 发 送 其 它 消 息 给 服 
务 器 。 


E 

















这 个 过 程 会 一 直 循 环 ， 直 到 用 户 没 有 给 任何 输入 时 ， 连 接 结束 。 结 束 时 ， 就 不 是 调用 transport 
WAN write O 函数 传 数 据 给 服务 器 了 ， 而 是 调用 loseConnection O 函数 来 关闭 套 接 字 。 这 时 ， 工 
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厂 的 clientConnectionLost () 函数 会 被 调用 ， 同 时 ，reactor 就 被 关闭 ， 脚 本 的 执行 就 结束 了 。 
于 某 些 原因 ，clientConnectionFailed OIT, reactor 也 会 被 关闭 。 














脚本 的 最 后 一 部 分 是 创建 一 个 客户 工厂 ， 连 接 到 服务 器 ， 然 后 运行 reactor。 注 意 ， 我 们 在 这 里 
实例 化 了 客户 端 工厂 ， 而 不 是 像 在 服务 器 里 那样 把 它 传 到 reactor 中 。 这 是 因为 ， 我 们 不 是 等 待 客 
户 连接 的 服务 器 ,服务 器 在 有 连接 时 要 为 每 个 连接 创建 一 个 新 的 protocol 对 象 。 我 们 只 是 一 个 客户 ， 
所 以 我 们 只 要 创建 一 个 protocol 对 象 ， 连 接 到 服务 器 ， 服 务 器 的 工厂 会 创建 一 个 protocol 对 象 来 
与 我 们 对 话 。 



































16. 5.3 执行 TCP 服务 器 和 客户 端 





Twisted 客户 显示 的 内 容 与 我 们 之 前 的 客户 类 似 : 


$ tsTcintTW. py 
> Where is hope 
... Sending Where is hope... 

[Tue Apr 18 23:53:09 2006] Where is hope 
2^ When words fail 

... sending When words fail... 

[Tue Apr 18 23:53:14 2006] When words fail 

> 
$ 





服务 器 又 回 到 了 只 有 一 个 连接 的 情况 。Twisted 维护 连接 ， 不 会 在 每 个 消息 后 都 关闭 














$ tsTservIW. py 
waiting for connection... 
... connected from: 127. 0.0.1 








“connection from” 输 出 没有 其 它 的 信息 , 因为 我 们 只 问 服务 器 的 transport 对 象 的 getPeer () 
函数 要 了 主机 地 址 的 信息 。 








16. 6 相关 模块 








表 16.4 列 出 了 其 它 与 网 络 和 套 接 字 相 关 的 Python 模块 。select 模块 通常 在 底层 套 接 字 程序 中 
与 socket 模块 联合 使 用 。 它 提供 的 select O 函数 可 以 同时 管理 多 个 套 接 字 对 象 。 





























它 最 有 用 的 功能 就 是 同时 监听 多 个 套 接 字 的 连接 。select 0 函数 会 阻塞 ， 直 到 有 至 少 一 个 套 接 
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字 准 备 好 要 进行 通讯 的 时 候 才 退出 。 








它 提供 了 哪些 套 接 字 已 经 准备 好 可 以 开始 读 取 的 集合 。( 它 也 提供 了 哪些 套 接 字 已 经 准备 好 可 以 
开始 写 的 集合 ， 不 过 这 个 功能 相对 来 说 不 大 常用 ) 














async* 和 SocketServer 模块 在 创建 服务 器 方面 都 提供 了 高 层次 的 功能 。 由 于 是 基于 socket 和 
(BE) select 模块 ,封装 了 所 有 的 底层 的 代码 ， 它 们 使 得 你 可 以 快速 开发 客户 /服务 器 的 系统 。 你 所 
需要 做 的 只 是 从 适当 的 基 类 中 派生 出 一 个 新 的 类 。 所 有 的 东西 就 已 经 就 绕 了 。 就 像 之 前 所 说 的 ， 
SocketServer 甚至 提供 了 把 线程 或 进程 集成 到 服务 器 中 的 功能 ， 以 实现 更 好 的 对 客户 请 求 的 并 行 处 
理 的 能 力 。 























虽然 async# 是 标准 库 提 供 的 唯一 的 异步 开发 支持 库 。 我 们 也 可 选择 如 Twisted 这 样 的 ， 相 对 标 
准 库 更 现代 ， 更 强大 的 第 三 方 库 。 虽 然 这 里 看 到 的 例子 代码 比 之 前 的 什么 都 自己 处 理 的 代码 稍微 长 
那么 一 点 ，Twisted 提供 了 更 为 强大 ， 更 具 弹性 的 框架 。 它 已 经 实现 了 很 多 协议 。 你 可 以 在 下 面 的 网 
站 找到 更 多 有 关 Twisted 的 信息 : 





























http://twistedmatrix. com 


表 16.4 网 络 / 套 接 字 编程 相关 模块 


模块 描述 E 
socket 底层 网 络 接 口 。 本 章 讨论 过 。 
























































asyncore/ 为 能 异步 处 理 客户 请 求 的 网 络 应 用 程序 提供 底层 功能 。 

asynchat 

select 在 单线 程 网 络 服务 器 程序 中 ， 管 理 多 个 套 接 字 连接 。 

SocketServer ”包含 了 写 网 络 应 用 程序 服务 器 所 需要 的 高 级 别 模 块 。 提供 了 完整 的 进程 和 线程 
的 版 本 。 





我 们 本 章 所 讨论 的 主题 涵盖 了 在 Python 中 用 socket 网 络 编程 和 如 何 用 低级 别 的 协议 如 TCP/IP 
和 UDP/IP 来 创建 应 用 程序 。 如 果 你 想 要 开发 高 层次 的 网 页 和 Internet. 应 用 程序 ， 我 们 强烈 建议 你 
阅读 第 17 章 和 第 20 章 。 














16. 7 练习 


16-1 — 套 接 字 。 面 向 连接 和 无 连接 有 什么 区 别 ? 

16-2. ”客户 /服务 器 架构 。 用 你 自己 的 语言 描述 这 个 架构 ， 并 给 出 几 个 例子 。 

16-3. BF. TCP 和 UDP 中 ， 哪 一 种 服务 器 在 接受 连接 后 ， 把 连接 交 给 不 同 的 套 接 字 处 理 
与 客户 的 通讯 。 

16-4. 客户。 修改 TCP(tsTclnt.py) 和 UDP(tsUclnt. py) 客 户 端 ， 让 服务 器 的 名 字 不 要 在 代码 
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里 写 死 ,要 允许 用 户 指定 一 个 主机 名 和 端口 ， 只 有 在 两 个 值 都 没有 输入 的 时 候 ,， 才 使 用 默认 值 。 

16-5. Intenet 网 络 和 套 接 字 。 找 到 Python Library Reference # 7.2.2 节 贵 铎 范 F Wed 
的 示例 

TCP 客户 /服务 器 程序 ， 实 现 它 并 让 它 运 行 起 来 。 先 运行 服务 器 ， 然 后 是 客户 端 。 源 代码 的 

一 个 在 线 版 本 可 以 在 这 里 找到 : 

http://www. python. org/doc/current/lib/ Socket Example. html 

你 认为 这 个 服务 器 太 无 聊 了 ， 决 定 要 修改 服务 器 ， 让 它 能 识别 以 下 命令 : 

date ”服务 器 将 返回 它 的 当前 时 间 i.e., time. ctime (time. time O) os 得 到 操作 系统 的 信息 
(os. name) 

Is ”得 到 当前 目录 的 文件 列表 (提示 : os.listdir 0 可 以 得 到 目录 列表 ，os. curdir 能 得 到 当 
前 目录 ) 附加 题 : 要 能 接受 “1s dir” 指 令 ， 并 返回 dir 目录 的 文件 列表 。 
































做 这 个 作业 的 时 候 ， 你 不 一 定 要 有 网 络 一 一 你 的 机 器 可 以 跟 自 己 通讯 。 注 : 在 服务 器 退出 后 ， 
要 清除 绑 定 后 才能 再 次 运行 。 和 否则 ， 有 可 能 得 碰 到 “端口 已 经 被 使 用 ”(“ port already bound”) 的 
错误 信息 。 操 作 系统 一 般 会 在 5 分 钟 内 清除 绑 定 。 所 以 ， 请 耐心 等 待 。 











16-6. ”日 期 时 间 服 务 。 使 用 socket. getservbyname O 函数 得 到 UDP 协议 中 ,“daytime” 服 务 
所 对 应 的 端口 。 请 参考 getservbyname() K AMM CM, Bh AA A. CR: 
socket.getservbyname. doc )。 现 在 ， 写 一 个 程序 发 送 一 个 随便 什么 数据 过 去 ， 等 待 回 答 。 一 
旦 你 收 到 了 服务 器 的 信息 ， 显 示 到 屏幕 上 。 * 














16-7. — 半 双 工 聊天 。 创 建 一 个 简单 的 ， 半 双 工 的 聊天 程序 。“ 半 双 工 ” 的 意思 是 当 创建 一 个 
连接 ， 服 务 启动 的 时 候 ， 只 有 一 个 人 可 以 打字 ， 另 一 个 人 只 有 在 等 到 有 消息 通知 他 输入 消息 时 ， 才 
能 说 话 。 一 旦 消息 发 送出 去 后 ， 要 等 到 有 回复 了 才能 发 送 下 一 条 消息 。 一 个 人 是 服务 端 ， 另 一 个 人 
是 客户 端 


























16-8. ”全 双 工 聊天 。 修 改 你 刚才 的 程序 ， 改 成 全 双 工 ， 即 两 个 人 可 以 独立 地 发 送 和 接收 消息 。 

16-9. ”多 用 户 全 双 工 聊天 。 再 次 修改 你 的 程序 ， 把 聊天 服务 改 成 支持 多 用 户 版 本 。 

16-10. ”多 用 户 ， 多 房间 全 双 工 聊天 。 现 在 把 聊天 服务 改 成 支持 多 个 用 户 ， 多 个 房间 。 

16-11. ”网 页 客户 。 写 一 个 TOP 客户 ， 连 到 你 最 喜欢 的 网 站 的 80 端口 (去 掉 “http://” 和 其 
它 的 后 级 信息 ， 只 用 主机 名 )。 一 旦 创建 了 一 个 连接 ， 发 送 HTTP 命令 字符 串 “GET /A\n”， 把 服务 

器 返回 的 所 有 数据 写 到 一 个 文件 中 。(GET 命令 用 于 得 到 网 页 ,“/ ”表示 要 得 到 的 文件 ,“\n” 把 
命令 发 送 到 服务 器 )。 检 查 得 到 的 文件 的 内 容 ， 它 是 什么 ? 怎么 检查 你 得 到 的 数据 是 否 正确 ? QE: 
你 可 能 要 在 命令 后 加 一 个 或 是 两 个 回 车 ， 一 般 来 说 ， 一 个 就 可 以 了 。) 
























































16-12. ”休眠 服务 器 。 创 建 一 个 “休眠 ”服务 器 ， 客 户 可 以 要 求 要 “休眠 ” 几 秒 钟 。 服 务 右 就 
去 做 休眠 的 操作 。 休 眠 结束 后 ， 返 回 一 个 消息 给 客户 ， 表 示 结 束 。 客 户 在 收 到 消息 的 时 候 ， 应 该 刚 
好 等 待 了 指定 的 时 间 。 这 就 是 一 个 简单 的 “远程 过 程 调用 ”(“remote procedure call”), BURAK 
送 一 个 指令 ， 网 络 另 一 边 的 远程 的 机 器 执行 这 个 命令 。 
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16-13. 名 字 服 务 器 。 设 计 并 实现 一 个 名 字 服 务 器 。 这 个 服务 器 负责 维护 一 个 主机 名 一 端口 对 的 
数据 库 ， 以 及 一 个 描述 这 个 服务 器 提供 的 服务 的 字符 串 。 选 择 一 个 或 几 个 服务 器 到 你 的 名 字 服 务 器 
上 进程 “注册 ” 《注意 ， 这 时 ， 这 些 服 务 器 是 名 字 服 务 器 的 客户 )。 每 一 个 客户 在 启动 的 时 候 ， 都 不 
知道 它们 想 要 找 的 服务 器 的 信息 。 名 字 服 务 器 的 客户 也 是 这 样 。 这 些 客户 应 该 发 送 一 个 请 求 到 名 字 
服务 器 ， 说 明 它 们 想 要 得 到 什么 服务 。 名 字 服 务 器 返回 一 个 主机 名 一 端口 对 给 客户 ， 客 户 这 时 就 可 
以 连 到 合适 的 服务 器 来 处 理 它 的 请 求 。 






























































附加 题 : 

(1) 在 名 字 服 务 器 中 ， 加 入 对 常用 请 求 的 缓冲 。 

(2) 在 名 字 服 务 器 中 ， 加 入 日 志 功 能 ， 记 录 下 哪个 服务 器 注册 了 ， 客 户 在 请 求 哪 一 个 服务 。 
(3) 名 字 服 务 器 应 该 周期 性 地 “ping” 这 些 注 册 了 的 服务 器 的 对 应 端口 ， 以 确定 这 些 服 务 器 
还 在 运行 中 。 在 连续 数 次 ping 失败 后 ， 就 把 这 个 服务 器 从 列表 中 删除 。 























你 可 以 实现 一 些 真 实 的 服务 ， 来 注册 到 你 的 名 字 服 务 器 上 ， 或 者 也 可 以 使 用 一 些 哑 服 务 〈 它 们 
根本 不 对 请 求 做 应 答 )。 


16-14. 错误 检查 和 优美 的 退出 。 本章 中 , 我 们 所 有 客户 和 服务 器 的 例子 代码 都 没有 做 错误 检查 。 
我 们 没有 检查 用 户 是 否 按 下 了 C 来 退出 服务 ， 或 D 来 结束 客户 输入 ， 也 没有 检查 raw input O 函数 
得 到 的 输入 的 合法 性 ， 也 没有 检查 网 络 错误 。 由 于 这 些 弱点 ， 我 们 很 可 能 会 在 退出 程序 的 时 候 ， 没 
有 关闭 套 接 字 ， 也 有 可 能 会 丢失 数据 。 选 择 一 对 客户 /服务 器 例子 ， 加 入 足够 的 错误 检查 ， 让 程序 è 























能 正常 的 退出 。 比 方 说 会 关闭 网 络 连接 。 








16-15. 异步 和 SocketServer。 选 取 TCP 服务 器 例子 ， 使 用 某 一 个 混合 类 (mix-in) ， 让 你 的 程序 
成 为 一 个 异步 服务 器 。 测 试 你 的 服务 器 ， 创 建 并 同时 运行 多 个 客户 ， 在 服务 器 的 输出 里 查看 你 的 服 
务 器 是 否 在 同时 响应 多 个 请 求 。 





16-16. # 扩 展 SocketServer 类 。 在 SocketServer TCP 服务 器 代码 中 ， 我 们 不 能 使 用 原来 的 TCP 
客户 ， 要 做 修改 。 这 是 因为 SocketServer 类 在 多 个 请 求 之 间 不 保持 连接 。(a) 从 TCPServer 和 
StreamRequestHandler 中 派生 出 新 的 类 ， 重 新 设计 服务 器 的 架构 ， 让 服务 器 能 为 每 个 客户 只 使 用 
个 连接 。( 而 不 是 每 个 请 求 一 个 连接 ) 

(b) 把 你 之 前 的 问题 的 解决 方案 应 用 到 (a) 部 分 ， 让 多 个 客户 的 请 求 可 以 被 并 行 地 处 理 。 
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网 络 客户 端 编程 


文件 传输 
文件 传输 协议 (FTP) 

网 络 新 闻 、Usenet， 和 新 闻 组 
网 络 新 闻 传 输 协 议 (NNTP) 
电子 邮件 

简单 邮件 传输 协议 (SMTP) 
邮局 协议 3 (POP3) 

相关 模块 
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Chapter 1 


在 之 前 的 章节 中 ， 我 们 已 经 大 致 了 解 了 那些 使 用 套 接 字 的 低级 别 的 网 络 通讯 协议 。 这 种 网 络 互 

连 是 当今 互联 网 中 大 部 分 客户 端 / 服务 器 协议 的 核心 。 这 些 网 络 协议 包括 文件 传输 (FTP，SCP 等 )， 
阅读 Usenet 新 闻 组 (NNTP) e-mail 发 送 (SMIP)， 从 服务 器 上 下 载 e-mail (POP3，IMAP) 等 等 。 这 些 
协议 的 工作 方式 与 之 前 在 套 接 字 编 程 中 介绍 的 客户 端 / 服务 器 的 例子 很 像 。 唯 一 的 不 同 在 于 ， 我 们 

已 经 使 用 过 TCP/IP 等 低级 别 的 协议 ， 并 基于 此 创建 了 新 的 ， 更 具体 的 协议 来 实现 我 们 刚刚 描述 的 



































服务 。 


17.1 什么 是 因特网 客户 端 ? 











在 着 手 研 究 这 些 协 议 之 前 ， 我 们 要 先 问 一 个 问题 :“ 因 特 网 客户 端 到 底 是 什么 ”? 要 回答 这 个 问 
题 ， 我 们 把 因特网 简化 成 一 个 数据 交换 中 心 ， 数 据 交 换 的 参与 者 是 一 个 服务 提供 者 和 一 个 服务 的 使 
用 者 。 有 的 人 把 它 称 为 “生产 者 一 消费 者 ”( 虽 然 这 个 词 一 般 只 用 在 讲解 操作 系统 相关 信息 时 )。 服 
务 器 就 是 生产 者 ， 它 提供 服务 ， 一 般 只 有 一 个 服务 器 《进程 或 主机 等 )， 和 多 个 消费 者 ， 就 像 我 们 之 
前 看 的 客户 端 / 服务 器 模型 那样 。 虽 然 现在 我 们 不 再 使 用 底 级 别 的 套 接 字 来 创建 因特网 客户 端 ， 但 
模型 是 完全 相同 的 。 












































这 里 ， 我 们 将 详细 了 解 三 个 因特网 协议 一 一 FTP，NNTP 和 POP3， 并 写 出 它们 的 客户 端 程序 。 通 
过 这 些 程序 ， 你 将 会 发 现 这 些 协议 的 API 是 多 么 的 相似 一 一 由 于 保持 接口 的 一 致 性 有 很 大 的 好 处 ， 
所 以 ， 这 些 相 似 性 在 设计 之 初 就 考虑 到 了 一 一 更 重要 的 是 ， 你 还 能 学 会 如 何 写 出 这 些 协议 与 其 它 协 
议 实用 的 客户 端 程序 来 。 虽 然 我 们 只 着 重 说 了 这 三 个 协议 。 在 看 完 这 些 协议 后 ， 你 就 能 有 足够 的 信 
心 和 能 力 写 出 任何 因特网 协议 的 客户 端 程序 了 。 
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17.2 文件 传输 

17.2.1 文件 传输 因特网 协议 


因特网 中 最 流行 的 事情 就 是 文件 的 交换 。 文 件 交 换 无 处 不 在 。 有 很 多 协议 可 以 供 因 特 网 上 传输 
文件 使 用 。 最 流行 的 有 文件 传输 协议 (FTP), Unix-to-Unix 复制 协议 (UUCP) ， 以 及 网 页 的 超 文本 传输 
协议 (HTTP) 。 另 外 , 还 有 (Unix 下 的 ) 远程 文件 复制 指令 rcp〈 以 及 更 安全 , 更 灵活 的 scp 和 Tsync )。 





























迄今 为 止 ，HTTP，FTP 和 scp/rsync 还 是 非常 流行 的 。HTTP 主要 用 于 网 页 文件 的 下 载 和 访问 Web 
服务 上 。 它 一 般 不 要 求 用 户 输入 登录 的 用 户 名 密码 就 可 以 访问 服务 器 上 的 文件 和 服务 。HTTP 文件 传 
输 请 求 主 要 是 用 于 获取 网 页 (文件 下 载 )。 

















相对 的 , scp 和 rsync 要 求 用 户 登 录 到 服务 器 , 否则 不 能 上 传 或 下 载 文 件 。 至 于 FTP, 跟 scp/rsync 
一 样 ， 可 以 上 传 或 下 载 文件 ， 还 采用 了 Unix 的 多 用 户 的 概念 ， 用 户 一 定 要 输入 有 效 的 用 户 名 和 密码 
才能 使 用 。 不 过 ，FTP 也 允许 匿名 登录 。 接 下 来 ， 我 们 先 仔 细 看 看 FTP。 


17.2.2 文件 传输 协议 《FTP) 


文件 传输 协议 由 已 故 的 Jon Postel 和 Joyce Reynolds 开发 ， 记 录 在 RFC(Request for 
Comment)959 号 文档 中 ， 于 1985 年 10 月 发 布 。 它 主要 用 于 匿名 下 载 公共 文件 。 也 可 以 用 于 在 两 台 

电脑 之 间 传 输 文件 ， 尤 其 是 在 使 用 Unix 系统 做 为 文件 存储 系统 ， 使 用 其 它 机 器 来 工作 的 情况 。 早 

在 网 络 流行 之 前 ，FTP 就 是 在 因特网 上 文件 传输 ， 软 件 和 源 代 码 下 载 的 主要 手段 之 一 。 



































FTP 要 求 输入 用 户 名 和 密码 才能 访问 远程 的 FTP 服务 器 , 但 它 也 允许 没有 帐号 的 用 户 以 匿名 用 户 
登录 ,不 过 ,管理 员 要 先 设置 FTP 服务 器 允许 匿名 用 户 登 录 。 这 时 ,匿名 用 户 的 用 户 名 是 “ anonymous ”， 
密码 一 般 是 用 户 的 e-mail 地 址 。 与 特定 的 用 户 拥有 特定 的 帐户 不 同 ， 这 有 点 像 是 把 FTP 公开 出 来 让 
大 家 访问 。 匿 名 用 户 通过 FTP 协议 可 以 使 用 的 命令 与 一 般 的 用 户 相 比 来 说 ， 限 制 更 多 。 


















































17-1 展示 了 这 个 协议 ， 其 工作 流程 如 下 : 


客户 端 连 接 远程 的 FTP 服务 器 

客户 端 输入 用 户 名 和 密码 CK “anonymous” M e-mail 地 址 ) 
客户 端 做 各 种 文件 传输 和 信息 查询 操作 

客户 端 登 出 远程 FTP 服务 器 ， 结 束 通讯 











pep hor 





当然 ， 这 只 是 很 泛 的 一 个 流程 。 有 时 ， 由 于 网 络 两 边 电脑 的 崩溃 或 是 网 络 的 问题 ， 会 导致 整个 
事务 在 完成 之 前 被 中 断 。 一 般 ， 在 客户 端 超过 15 分 钟 (900 秒 ) 不 活动 之 后 ， 连 接 就 会 被 关闭 。 
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在 底层 上 ，FTP 只 使 用 TCP〈 见 前 面 网 络 编程 相关 章节 ) 一 一 它 不 使 用 UDP. WE. FIP 是 客户 


端 / 服务 器 编程 中 很 “与 众 不 同 ” 的 例子 。 客 户 端 和 服务 器 都 使 用 两 个 套 接 字 来 通讯 : 一 个 是 控制 
和 命令 端口 〈21 号 端口 )， 男 一 个 是 数据 端口 (有 时 是 20 号 端口 )。 











éa rmi. |... FTP server 


| BEJ a data a. (Active) (Passive) 





20 or 
N (» 1023) 





17-1 因特网 上 的 FTP 客户 端 和 服务 器 。 客 户 端 和 服务 器 使 用 指令 和 控制 端口 发 送 FTP 协议 ， 
而 数据 通过 数据 端口 传输 。 








我 们 说 “有 时 ”是 因为 FTP 有 PARRA: 主动 和 被 动 。 只 有 在 主动 模式 服务 器 才 使 用 数据 端口 。 
在 服务 器 把 20 号 端口 设置 为 数据 端口 后 ， 它 “主动 ” 连接 客户 ? 山 的 数据 端口 。 而 被 动 模式 中 ， 服 务 
器 只 是 告诉 客户 端 它 的 随机 端口 的 号 码 ， oe Ps 须 主动 建立 数据 连接 。 在 这 种 模式 下 ， 你 会 看 到 ， 
FTP 服务 器 在 建立 数据 连接 时 是 “被 动 ”的 。 最 后 ， 现 在 已 经 有 了 一 种 扩展 被 动 模式 来 支持 第 6 版 本 
的 因特网 协议 〈IPv6) 地 址 一 一 见 RFC 2428. 




















Python 已 经 支持 了 包括 FTP 在 内 的 大 多 数据 因特网 协议 。 文 持 各 个 协议 的 客户 端 模块 可 以 在 
http://docs. python. org/lib/internet.html 找到 。 现 在 看 看 用 Python 创建 一 个 因特网 客户 端 程 
序 有 多 简单 。 








17. 2. 3 Python # FTP 





那么 ， 我 们 怎么 用 Python tj FIP 客户 端 程序 呢 ? 其 实 ， 我 们 之 前 已 经 提 到 过 一 些 了 。 现 在 还 
再 加 上 相应 的 Python 模块 导入 和 调用 的 操作 。 现 在 再 来 回顾 一 下 流程 : 


58 





1 连接 到 服务 器 

2. 登录 

3. ”发 出 服务 请 求 (有 可 能 有 返回 信息 ) 
4 退出 








在 使 用 Python 的 FTP 支持 时 ， 你 所 需要 做 的 就 是 导入 ftplib 模块 ， 并 实例 化 一 个 ftplib. FTP 
类 对 象 。 所 有 的 FTP 操作 (如 登录 , 传输 文件 和 登 出 等 ) 都 要 使 用 这 个 对 象 来 完成 。 下 面 是 一 段 Python 
的 伪 代 码 : 





from ftplib import FTP 
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f = FIP( ftp. python. org’) 


f. login anonymous’, 'guesswho. org’) 





f quit () 














在 看 真实 的 例子 之 前 ， 我 们 要 先 熟悉 一 下 ftplib. FTP 类 的 方法 ， 这 些 方法 将 在 代码 中 用 到 。 


17.2.4 ftplib. FIP 类 方法 














在 表 17.1 中 列 出 了 最 常用 的 方法 ， 这 个 表 并 不 全 面 一 一 想 查 看 所 有 的 方法 ， 请 参阅 模块 源 代码 
一 一 但 这 里 列 出 的 方法 组 成 了 我 们 在 Python 中 FTP 客户 端 编程 的 “API”。 














也 就 是 说 ， 你 不 一 定 要 使 用 其 它 的 方法 ， 因 为 它们 或 者 是 辅助 函数 ， 或 者 是 管理 函数 ， 或 者 是 
被 API 调用 的 。 














表 17.1 FTP 对 象 的 方法 














方法 描述 
login(user-' anonymous’ , 
passwd- ', acct-'') 登录 到 FTP 服务 器 ， 所 有 的 参数 都 是 可 选 的 
pwd () 得 到 当前 工作 目录 
cwd (path) 把 当前 工作 目录 设置 为 path 
dir ([path[,... [,cb]]) 显示 path 目录 里 的 内 容 ， 可 选 的 参数 cb 是 一 个 回调 函数 ， 它 
会 被 传 给 retrlines () 方 法 
nist ([path[,...]) 与 dir Q 类似 ， 但 返回 一 个 文件 名 的 列表 ， 而 不 是 显示 这 些 文 
件 名 
retrlines (cmd [, cb]) 给 定 FIP 命令 (如 “RETR filename”)， 用 于 下 载 文 本 文件 。 





可 选 的 回调 函数 cb 用 于 处 理 文件 的 每 一 行 





retrbinary (cmd, cbl, 

















bs=8192[, ra]]) 与 retrlinesQ 类 似 ， 只 是 这 个 指令 处 理 二 进 制 文件 。 回 调 函 
数 cb 用 于 处 理 每 一 块 〈 块 大 小 默认 为 8K) 下 载 的 数据 。 
storlines(cmd, f) 给 定 FTP 命令 (40 “STOR filename”), LAER MAE, X 





给 定 一 个 文件 对 象 f 
storbinary (cmd, fl, 

















bs-8192]) 与 storlines 0) 类似， 只 是 这 个 指令 处 理 二 进 制 文件 。 要 给 定 
一 个 文件 对 象 f£， 上 传 块 大 小 bs 默认 为 8Kbs=8192]) 

rename (old, new) 把 远程 文件 old 改名 为 new 

delete (path) 删除 位 于 path 的 远程 文件 

mkd (directory) 创建 远程 目录 
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rmd (directory) 删除 远程 目录 
quit Q 关闭 连接 并 退出 








在 一 般 的 FTP 通讯 中 ， 要 使 用 到 的 指令 有 login), cwdQ, dirO, pwdO, stor*O, retr*O 
和 quitQ. 。 有 一 些 没有 列 出 的 FTP 对 象 方法 也 是 很 有 用 的 。 请 参阅 Python 的 文档 以 得 到 更 多 关于 
FTP 对 象 的 信息 : 


http://python. org/docs/current/lib/ftp-ob jects. html 


17. 2. 5 交互 式 FTP 示例 


在 Python 中 使 用 FTP 非常 的 简单 ， 你 甚至 可 以 不 用 写 脚本 ， 直 接 在 交互 式 解释 器 中 实时 地 看 到 
交互 与 输出 。 下 面 这 个 例子 是 在 几 年 前 ，python. org 还 支持 ftp 服务 的 时 候 做 的 : 


>>> from ftplib import FTP 

>>> f = FTP('ftp.python.org') 

>>> f.login('anonymous', '-help@python.org') 
'230 Guest login ok, access restrictions apply.' 
>>> f.dir() 


total 38 

drwxrwxr-x 10 1075 4127 512 May 17 2000 . 
drwxrwxr-x 10 1075 4127 512 May 17 2000 .. 
drwxr-xr-x 3 root wheel 512 May 19 1998 bin 
drwxr-sr-x 3 root 1400 512 Jun 9 1997 dev 
drwxr-xr-x 3 root wheel 512 May 19 1998 etc 
lrwxrwxrwx 1 root bin 7 Jun 29 1999 lib -> usr/lib 
-r--r--r-- 1 guido 4127 52 Mar 24 2000 motd 
drwxrwsr-x 8 1122 4127 512 May 17 2000 pub 
drwxr-xr-x 5 root wheel 512 May 19 1998 usr 
>>> f.retrlines('RETR motd') 

Sun Microsystems Inc. SunOS 5.6 Generic August 1997 
'226 Transfer complete. 


>>> f.quit() 
'221 Goodbye.' 


17.2. 6 客户 端 FTP 程序 举例 





之 前 我 们 说 过 ， 你 可 以 不 写 脚本 ， 在 交互 环境 中 使 用 FTP。 不 过 ， 下 面 我 们 还 是 要 写 一 段 脚本 ， 
假设 你 要 从 Mozilla 的 网 站 下 载 最 新 的 Bugzilla 的 代码 。 例 17. 1 就 是 用 来 完成 这 个 工作 的 。 我 们 
在 试 着 写 一 个 应 用 程序 ， 不 过 ， 你 也 可 以 交互 式 地 运行 这 段 代 码 。 我 们 的 程序 使 用 FTP 库 来 下 载 文 
件 ， 也 做 了 一 些 错误 检测 。 





不 过 ， 程 序 并 不 完全 自动 。 你 要 自己 决定 什么 时 候 要 去 下 载 。 如 果 你 在 使 用 类 Unix 系统 ， 你 可 
以 设 定 一 个 “cron” 任 务 来 自动 下 载 。 另 一 个 问题 是 ， 如 果 文 件 的 文件 名 或 目录 名 改 了 的 话 ， 程 序 


就 不 能 正常 工作 了 。 
(€ 
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例 17.1 FTP 下 载 示 例 (getLatestFTP. py) 











这 个 程序 用 于 下 载 网 站 中 最 新 版 本 的 文件 。 你 可 以 修改 这 个 程序 让 它 下 载 你 喜欢 的 程序 。 





7 #!/usr/bin/env python 

2 

3 import ftplib 

4 import os 

5 import socket 

6 

7 HOST = "ftp. mozilla. org’ 

8 DIRN = "pub/mozilla.org/webtools' 

9 FILE = 'bugzilla-LATEST. tar. gz’ 

10 

11 def main: 

12 try: 

13 £ = ftplib. FTP (HOST) 

14 except (socket. error, socket. gaierror), e: 
15 print 'ERROR: cannot reach “s?” % HOST 


16 return 

17 print '*** Connected to host “s” % HOST 
18 

19 try: 


20 f. login 0) 

21 except ftplib.error perm: 

22 print 'ERKOR: cannot login anonymously’ 
23 f.quitQ 

24 return 

25 print '"*** Logged in as anonymous’ 

26 

27 try: 

28 f. cwa (DIRN) 

29 except ftplib.error perm: 

30 print 'ERROR: cannot CD to "s^ % DIRN 


31 f. quit?) 

32 return 

33 print '*** Changed to “%s” folder’ % DIRN 
34 

35 try: 
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36 f.retrbinary( RETR %s’ % FILE, 

37 open(FILE, 'wb'). write) 

38 except ftplib.error perm: 

39 print 'ERROR: cannot read file “s” % FILE 
40 os. unlink (FILE) 

4l else: 

42 print '«*** Downloaded “%s” to CWD? % FILE 
43 f. quit Q 

44 return 

45 

46 if name  -- ' main 

47 main O 











如 果 运 行 脚本 时 没有 出 错 ， 则 会 得 到 如 下 输出 : 


$ getLatestFIP. py 

xxx Connected to host “ftp. mozilla. org” 

xxx Logged in as /anonymous^ 
xxx Changed to “pub/mozilla. org/webtools” folder 
xxx Downloaded “bugzilla-LATEST. tar. gz~ to CWD 
$ 


逐 行 解释 


1-9 行 
代码 前 几 行 导入 要 用 的 模块 和 设置 一 些 常 





n 





11-44 fT 

main O 函数 分 为 以 下 几 步 : 创建 一 个 FTP 对 象 ， 尝 试 连接 到 FTP 服务 器 (12-17 行 ) 然后 返回 。 
在 有 任何 错误 发 生 的 时 候 退 出 。 我 们 党 试用 “anonymous” 登 录 ， 如 果 不 行 就 结束 (19-25 行 )。 下 一 
步 就 是 转 到 发 布 目 录 (27-33 行 )， 最 后 ， 下 载 文件 (35-44 íT). 














在 35-36 行 ， 我 们 传 了 一 个 回调 函数 给 retfbinary() ， 它 在 每 接收 到 一 块 二 进 制 数据 的 时 候 都 
会 被 调用 。 这 个 函数 就 是 我 们 创建 的 本 地 文件 对 应 文件 对 象 的 write 方法 。 在 传输 结束 的 时 候 , Py thon 
解释 器 会 自动 关闭 这 个 文件 对 象 ， 而 不 会 丢失 数据 。 虽 然 这 样 方便 ， 但 最 好 还 是 不 要 这 样 做 ， 做 为 
一 个 程序 员 , 要 尽量 做 到 在 资源 不 再 被 使 用 的 时 候 就 直接 释放 , 而 不 是 依赖 其 它 代码 来 做 释放 操作 。 
在 这 里 ， 我 们 应 该 把 文件 对 象 保 存 到 一 个 变量 中 ， 如 变量 loc， 然 后 把 loc.write 4 
ftp. retrbinary () 方 法 。 









































在 代码 中 ， 如 果 由 于 某 些 原因 我 们 无 法 保存 这 个 文件 ， 那 要 把 存在 的 空 文件 给 删 掉 ， 以 防 搞 乱 





$— 一 * 一 
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文件 系统 (40 行 )。 最 后 ， 我 们 使 用 了 try-except-else FAJ (35-42 行 )， 而 不 是 写 两 遍 关 闭 FTP 
连接 然后 返回 的 代码 。 











46-47 行 
这 是 运行 独立 脚本 的 惯用 方法 。 





17.2.7 FTP 的 其 它 方面 





Python 同时 支持 主动 和 被 动 模式 。 注 意 ， 在 Python2. 0 及 以 前 版 本 中 ， 被 动 模式 支持 默认 是 关 
闭 的 ， 在 Python2. 1 及 以 后 版 本 中 ， 默 认 是 打开 的 。 





以 下 是 一 些 典 型 的 FTP 客户 端 类 型 ; 

e 命令 行 客户 端 程序 : 你 可 以 使 用 一 些 FTP 文件 传输 工具 如 /bin/ftp 或 NcFTP， 它 们 人 允许 用 户 
在 命令 行 交互 式 的 参与 到 FTP 通讯 中 来 。 

€ GUI 客户 端 程序 ; 与 命令 行 客户 端 程序 相似 , 只 是 它 是 一 个 GUI 程序 。 如 WsFTP 和 Fetch 等 。 

e 网 页 浏览 器 : 在 使 用 HTTP 之 外 , 大 多 数 网 页 浏览 器 (也 是 一 个 客户 端 ) 可 以 进行 FTP 通讯 。 
URL/URI 的 第 一 部 分 就 用 来 表示 所 使 用 的 协议 ， 如 “http://blahblah. ”这 就 告诉 浏览 器 要 
使 用 HTTP 做 为 与 给 定 网 站 进行 通讯 的 协议 。 修 改 协议 部 分 ， 就 可 以 发 使 用 FTP 的 请 求 ， 如 

“ftp://blahblah. ”, Xx ER fs FH] HTTP 的 网 页 的 URL 很 像 .( 当 然 ,“ftp://” 后 面 的 “blahblah” E 

















可 以 展开 为 “host/path?attributes”)。 如 果 要 登录 ， 用 户 可 以 把 登录 信息 (以 明文 方式 ) 
放 在 URL 里 ， 如 : “ftp://user:passwd@host/path?attrl=vall&attr2=val2. . .". 

e 定制 程序 : 你 自己 写 的 用 于 FTP 文件 传输 的 程序 。 由 于 程序 用 于 特殊 目的 ， 一般 这 种 程序 都 
不 允许 用 户 与 服务 器 接触 。 











这 四 种 客户 端 类 型 都 可 以 用 Python 来 写 。 上面 , 我 们 用 ftplib 来 创建 了 一 个 自己 的 定制 程序 ， 
你 也 可 以 自己 做 一 个 命令 行 的 应 用 程序 。 在 命令 行 的 基础 上 ， 你 可 以 使 用 一 些 界面 工具 包 ， 如 Tk, 
wxWidgets, GTK+, Qt, MFC, H2 Swing (要 导入 相应 的 Python[ 或 Jython] 的 接口 模块 ) 来 创建 一 
个 完整 的 GUI 程序 。 最 后 ， 你 可 以 使 用 Python 的 urllib 模块 来 解析 FTP 的 URL 并 进行 FTP 传输 。 
在 urllib 的 内 部 也 导入 并 使 用 了 ftplib, urllib 也 是 ftplib 的 客户 端 。 























FTP 不 仅 可 以 用 在 下 载 应 用 程序 上 ， 还 可 以 用 在 系统 之 间 文 件 的 转移 上 。 比 如 ， 如 果 你 是 一 个 工 
程 师 或 是 系统 管理 员 ， 你 需要 传输 文件 。 在 跨 网 络 的 时 候 ， 很 明显 可 以 使 用 scp 或 rsync 命令 , 或 
者 把 文件 放 到 一 个 外 部 能 访问 的 服务 器 上 。 不 过 ， 在 一 个 安全 网 络 的 内 部 机 器 之 间 移 动 大 量 的 日 志 
或 数据 库 文件 ， 这 种 方法 的 开销 就 太 大 了 ， 要 注意 安全 性 ， 加 密 ， 压 缩 ， 解 压缩 等 。 如 果 你 想 要 做 
的 只 是 写 一 个 FTP 程序 来 帮助 你 在 下 班 后 自动 移动 文件 ， 那 用 Python 是 一 个 非常 好 的 主意 。 


















































从 FTP 协议 定义 / 规范 (RFC 959) 中 ， 你 可 以 得 到 更 多 关于 FTP 的 信息 : 
ftp://ftp. isi. edu/in-notes/rfc959. txt 以 及 网 页 
http://www. networksorcery. com/enp/protocol/ftp. htm。 其 它 相 关 的 RFC 有 2228, 2389, 
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2428, 2577, 2640 和 4217。 想 了 解 更 多 Python 对 FTP 的 支持 ， 可 以 从 这 里 开始 : 
http://python. org/docs/current/lib/module-ftplib. html. 


17.3 网 络 新 闻 
17.3. 1 Usenet 与 新 闻 组 
Usenet 新 闻 系 统 是 一 个 全 球 存 档 的 “电子 公告 板 ”。 各 种 主题 的 新 闻 组 一 应 俱全 , 从 诗歌 到 政治 ， 


从 自然 语言 学 到 计算 机 语言 ， 软 件 到 硬件 ， 种 植 到 庆 饪 招工， 应 聘 ， 首 乐 ， 魔 术 ， 分 手 ， 求 爱 等 。 
新 闻 组 可 以 是 面向 全 球 泛 泛 而 谈 ， 也 可 以 是 只 面向 某 个 地 理 区 域 。 











整个 系统 是 一 个 由 大 量 计 算 机 组 成 的 一 个 庞大 的 全 球 网 络 , 计算 机 之 间 共 享 Usenet 上 的 帖子 . 如 
果 某 一 个 用 户 发 了 一 个 帖子 到 本 地 的 Usenet. 计算 机 上 , 这 个 帖子 会 被 传播 到 其 它 相连 的 计算 机 上 ， 
并 再 由 这 些 计算 机 传 到 与 它们 相连 的 计算 机 上 , 直到 这 个 帖子 传播 到 了 全 世界 ， 每 个 人 都 收 到 这 个 帖 
TAE. 




















每 个 系统 都 有 一 个 它 已 经 “订阅 ”的 新 闻 组 的 列表 ， 它 只 接收 它 感 兴趣 的 新 闻 组 里 的 帖子 一 一 
而 不 是 服务 器 上 所 有 新 闻 组 的 帖子 。Usenet 新 闻 组 服务 内 容 取 决 于 服务 提供 者 ， 很 多 都 是 可 供 公 众 
访问 的 ， 也 有 一 些 只 允许 特定 的 用 户 使 用 ， 例 如 付费 用 户 ， 特 定 大 学 的 学 生 等 。 如 果 Usenet 系统 

















管理 员 设 置 了 的 话 ， 有 可 能 会 要 求 输入 用 户 名 和 密码 。 管 理 员 也 可 以 设置 是 否 只 允许 上 传 或 只 允许 
下 载 。 























17. 3.2 网 络 新 闻 传 输 协议 (NNTP) 





供用 户 在 新 闻 组 中 下 载 或 发 表 帖 子 的 方法 叫 网 络 新 闻 传 输 协 议 (CNNTP)。 它 由 BrainKantor (加 
利 福 尼 亚 大 学 圣地 亚 哥 分 校 ) 和 Phil Lapsley (加利福尼亚 大 学 伯克利 分 校 ) 创建 并 记录 在 RFC 977 
H, F 1986 年 2 月 公布 。 其 后 的 更 新 记录 在 RFC 2980, F 2000 年 10 月 公布 。 





























作为 客户 端 / 服务 器 架构 的 另 一 个 例子 ，NNTP 与 FTP 的 操作 方式 很 像 ， 而 且 简 单 得 多 。FTP 需 
要 不 同 的 端口 来 做 登录 ， 数 据 传输 和 控制 ， 而 NNTP 只 使 用 一 个 标准 端口 119 来 做 通讯 。 你 给 服务 器 
一 个 请 求 ， 它 做 相应 的 反馈 ， 见 图 17-2. 
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在 因特网 上 使 用 Usenet 
了 
É SN 
S 
NNTP 
clients 
(newsreaders) 
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图 17-2 因特网 上 的 NNTP 客户 端 和 服务 器 。 客 户 端 主要 阅读 新 闻 ， 有 时 也 发 帖子 。 文 章 会 在 服 
务 器 之 间 做 同步 。 


17. 3. 3 Python 和 NNTP 





wes — 








由 于 之 前 已 经 有 了 Python 和 FIP 的 经 验 ， 你 也 许可 以 猜 到 ， 一 定 有 一 个 库 nntplib 和 一 个 类 
你 猜 对 了 。 用 FTP 一 样 ， 我 们 所 要 做 的 就 是 导入 那个 Python 
模块 ， 然 后 调用 相应 的 方法 。 我 们 先 大 致 看 一 下 这 个 协议 : 


nntplib. NNTP， 你 要 实例 化 这 个 类 。 


连接 到 服务 器 

登录 《如 果 需 要 的 话 ) 
发 送 请 求 

退出 





PN Lr 


是 不 是 有 点 熟悉 ? 是 的 ， 这 几乎 就 是 完全 复制 了 FTP 协议 。 唯 一 的 不 同 就 是 根据 NNTP 服务 器 的 





配置 不 一 样 ， 登 录 这 一 步 是 可 选 的 。 
下 面 是 一 段 Python 的 伪 代 码 : 


from nntplib import NNTP 
n = NVIP( your. nntp. server’ ) 


r, c, f, l, g = n. group( comp. lang. python’) 


n. quit (Q 





—9— 
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一 般 来 说 ， 在 你 登录 完成 后 ， 你 要 调用 group 0 方法 来 选择 一 个 感 兴趣 的 新 闻 组 。 方 法 返回 服务 
器 的 返回 信息 ， 文 章 的 数量 ， 第 一 个 和 最 后 一 个 文章 的 ID， 以 及 组 的 名 字 。 在 有 了 这 些 信息 后 ， 你 
会 做 一 些 其 它 的 操作 ， 如 从 头 到 尾 看 文章 ， 下 载 整个 帖子 《文章 的 标题 和 内 容 )， 或 者 发 表 一 篇 文章 


Aix 
"do 
































在 看 真实 的 例子 之 前 ， 我 们 要 先 介绍 一 下 nntplib. NNTP 类 的 一 些 常用 的 方法 。 





17. 3.4 nntplib.NNTP 类 方法 








跟前 一 节 列 出 ftplib. FTP 类 的 方法 时 一 样 ， 我 们 不 会 列 出 nntplib. NNTP 的 所 有 方法 ， 只 列 出 
你 创建 NNTP 客户 端 程序 时 可 能 用 得 着 的 方法 。 














表 17.2 NNTP 对 象 的 方法 





方法 描述 

group (name) 选择 一 个 组 的 名 字 ， 返 回 一 个 元 组 (rsp, ct, fst, 1st, group): 
服务 器 的 返回 信息 ， 文 章 的 数量 ， 第 一 个 和 最 后 一 个 文章 的 号 
码 以 及 组 名 ， 所 有 数据 都 是 字符 串 。( 返 回 的 group 与 我 们 传 


进去 的 name 应 该 是 相同 的 ) 
xhdr(hdr, artrg, 
[ofile]) 返回 文章 范围 artrg( 3k - FÉ" 的 格式 ) 内 文章 hdr 头 的 列表 , 或 


输出 到 文件 ofile 中 


















































body(id[， 

ofile]) 给 定 文章 的 id, id 可 以 是 消息 的 IJD《 放 在 尖 括 号 里 )， 或 一 
个 文章 号 〈 是 一 个 字符 串 )， 返 回 一 个 元 组 (fsp，anum，mid， 
data): 服务 器 的 返回 信息 ， 文 章 号 〈 是 一 个 字符 串 )， 消 息 
的 ID《〈 放 在 尖 括 号 里 )， 和 文章 所 有 行 的 列表 或 把 数据 输出 到 
文件 ofile 中 。 

head (id) 与 body O 相似， 只 是 返回 的 元 组 中 那个 行 的 列表 中 只 包含 了 
文章 的 标题 。 

article(id) 也 跟 body 0) 一样， 只 是 返回 的 元 组 中 那个 行 的 列表 中 包含 了 
文章 的 标题 和 内 容 。 

stat (id) 让 文章 的 “指针 ”指向 id( 同 上， 是 一 个 消息 的 ID 或 是 文章 
的 号 码 )。 返 回 一 个 跟 body 一 样 的 元 组 (rsp，anum，mid)， 
但 不 包含 文章 的 数据 。 

next () 用 法 和 stat O 类 似 ， 把 文章 指针 移 到 下 一 篇 文章 ， 返 回 与 
stat O 相似 的 元 组 

last) 用 法 和 stat 0) 类似， 把 文章 指针 移 到 最 后 一 篇 文章 ， 返 回 与 
stat () 相似 的 元 组 

—e— 
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post (ufile) 上 传 ufile 文件 对 象 里 的 内 容 (使 用 ufile. readline() ), 
在 当前 新 闻 组 发 表 。 
quit Q 关闭 连接 ， 然 后 退出 











跟 上 一 节 的 FTP 对 象 表 一 样 ， 还 有 一 些 NNTP 对 象 的 方法 没有 提 及 。 为 了 避免 混乱 ， 我 们 只 列 出 
了 你 可 能 用 得 到 的 。 其 余 的 ， 我 们 再 次 建议 你 参考 Python 手册 。 











17.3.5 交互 式 NNTP 举例 


接 下 来 ， 是 一 个 如 何 使 用 Python 中 NTP 库 的 交互 式 的 例子 。 它 看 上 去 跟 交 互 式 的 FTP 的 例子 
差不多 。( 出 于 保密 的 原因 ，e-mail 地 址 都 做 了 修改 )。 





在 调用 表 17. 2 中 所 列 的 group 0 方法 连接 到 一 个 组 的 时 候 ， 你 会 得 到 一 个 长 度 为 5 的 元 组 。 





>>> from nntplib import NNTP 

2» n = NVIP( your. nntp. server’) 

22^ rsp, ct, fst, Ist, grp = n.group( comp. lang. python’) 

> rsp, anum, mid, data = n. article( 110457’) 

222 for eachLine in data: 

print eachLine 

From: “Alex Martelli’ <alex@..> Subject: Re: Rounding Question 
Date: Wed, 21 Feb 2001 17:05:36 +0100 

“Remco Gerlich” <remco@..> wrote: 

^ Jacob Kaplan-Moss <jacob@..> wrote in comp. lang. python: 

2^ So I've got a number between 40 and 130 that I want to round up to 
22^ the nearest 10. That is: 

pe 

>> 40 ——> 40, XI--— 50, ..., 49 -- 50, 50 = 50, 51 -> BU 

22 Rounding like this is the same as adding 5 to the number and then 
> rounding down. Rounding down is substracting the remainder if you were 
> to divide by 10, for which we use the % operator in Python. 


This will work if you use +9 in each case rather than +5 (note that he doesn't 


really want rounding —— he wants 41 to 'round' to 50, for ex). 


Alex 

2» n. quit 0 

'205 closing connection - goodbye!’ 
225 
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17.3. 6 客户 端 程序 NNTP 举例 








在 NNTP 客户 端 例子 中 ， 我 们 来 点 更 复杂 的 。 在 之 前 的 FTP 客户 端 例子 中 ， 我 们 是 下 载 最 新 的 文 
件 ， 这 一 次 ， 我 们 要 下 载 Python 语言 新 闻 组 com. lang. python 里 的 最 后 一 篇 文章 。 





下 载 完成 后 ， 我 们 会 显示 文章 的 前 20 行 ， 而 且 是 前 20 行 有 意义 的 内 容 。 有 意义 的 内 容 是 指 那 
些 不 是 被 引用 的 文本 〈 引 用 以 “>” 或 “| ”开头 )， 也 不 是 像 这 样 的 文本 “In article <. .>, 


soAndSo@some. domain wrote: ”。 








最 后 ， 我 们 要 智能 的 处 理 空 行 。 在 文章 中 出 现 了 一 行 空 行 ， 那 我 们 就 显示 一 行 空 行 ， 但 如 果 有 
多 行 连续 的 空 行 ， 那 只 显示 一 行 空 行 。 只 有 有 数据 的 行 才 算 在 “前 20 行 ”之 中 。 所 以 ， 最 多 可 能 显 
AS 39 行 输出 ，20 行 实际 数据 间隔 了 19 行 空 行 。 

















如 果 脚 本 的 运行 正常 的 话 ， 我 们 可 能 会 看 到 这 样 的 输出 : 





$ getLatestNWIP. py 

xxx Connected to host “your. nntp. server^ 
xxx Found newsgroup “comp. lang. python ^ 
xxx Found last article (#471526): 


From: “Gerard Flanagan” <grflanagan@ ..> 

Subject: Ke: Generate a sequence of random numbers that sum up to 1? Date: Sat Apr 22 
10:48:20 CEST 2006 

xxx First (<= 20) meaningful lines: 

def partition (N=5): 

vals = sorted( random. random) for | in range(2#N) ) 

vals = [0] + vals + [1] 

for j in range (2*N+1): 

yield vals[j:j+2] 

deltas = [ x[1]-x[0] for x in partition J 

print deltas 


print sum(deltas) 

[0. 10271966686994982, 0. 13826576491042208, 0. 064146913555132801, 
0. 11906452454467387, 0. 10501198456091299, 0. 011732423830766779, 
0. 11785369256442912, 0. 065927165520102249, 0. 0983513058781706198, 
0. 077786747076205365, 0. 099139810689226726 ] 

1.0 
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例 17. 2 NNTP 下 载 示 例 CgetFirstNNTP. py) 





这 个 脚本 下 载 并 显示 Python 新 闻 组 comp. lang. python 最 后 一 篇 文章 的 前 20 个 “有 意义 的 ” 行 。 


7 #l/usr/bin/env python 
2 
3 import nntplib 
4 import socket 
5 
6 HOST = ° your. nntp. server’ 
7 GRNM = "comp. lang. python’ 
8 USER = ’ wesley’ 
9 PASS = you’ 1 NeverGuess ^ 
10 
11 def main: 
12 
13 try: 
14 n = nntplib. NNTP (HOST) 
15 £, user=USER, password=PASS) 
16 except socket.gaierror, e: 
17 print 'ERROR: cannot reach host “%s”’ % HOST 
18 print ' (%s”)’ % eval(str(e)) [1] 
19 return 
20 except nntplib. NNTPPermanentError, e: 
21 print 'ERROR: access denied on "s^ % HOST 
22 print ' ("*s^)' 8 str(e) 


23 return 

24 print '** Connected to host “%s”” % HOST 
25 

26 try: 


27 rsp, ct, fst, Ist, grp = n. group (GRNM) 

28 except nntplib. NNTPTemporaryError, e: 

29 print 'ERKOR: cannot load group ^"s^ % GRNM 
30 print ' (C*s^)' % str(e) 

31 print ? Server may require authentication’ 
32 print ' Uncomment/edit login line above’ 

33 n quit 0 

34 return 

35 except nntplib. NNTPTemporaryError, e: 
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36 print 'ERROR: group “%s” unavailable’ % GRNM 
37 print Cas)” % str(e) 





38 n. quit O 

39 return 

40 print '*** Found newsgroup “%s”” % GRNM 
41 


42 rng = 'fs-Ws' % (Ist, Ist) 

43 rsp, frm = n.xhdr( from’, rng) 
44 rsp, sub = n.xhdr( subject’, rng) 
45 rsp, dat = n.xhdr( date’, rng) 
46 print '''*«** Found last article (#%s): 

47 

48 From: fs 

49 Subject: fs 

50 Date: %s 

51 "5 (Ist frm[0][1], sub[0][1], dat[0][1]) 
32 

53 rsp, anum, mid, data = n. body (lst) 

54 displayFirst20 (data) 

55 n. quit O 

56 

57 def displayFirstZ0(data): 

58 print '*** First (<= 20) meaningful lines: |n' 
59 count = 0 

60 lines = (line.rstrip( for line in data) 
61 lastBlank - True 

62 for line in lines: 

63 if line: 

64 lower = line. lower () 

65 if (lower. startswith( »') and not | 

66 lower. startswith(>»»’)) or | 

67 lower. startswith( /’) or | 

68 lower. startswith( in article’) or | 

69 lower. endswith( writes:') or | 

70 lower. endswith ( wrote:'): 

71 continue 

72 if not lastBlank or (lastBlank and line): 
73 print ' %s’ % line 

74 if line: 

75 count += 7 
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76 lastBlank = False 

/7 else: 

/8 lastBlank - True 

/9 if count -- 20: 

80 break 

8&1 

82 if name ==’ main 


83 main 0) 














这 个 输出 显示 了 新 闻 组 帖子 的 原始 内 容 ， 如 下 : 


From: “Gerard Flanagan” <grflanagan@ ..> 

Subject: ke: Generate a sequence of random numbers that sum up to 1? Date: Sat Apr 22 
10:48:20 CEST 2006 

Groups: comp. lang. python 


Gerard Flanagan wrote: 
> Anthony Liu wrote: 
>> I am at my wit’s end. 


^ > I want to generate a certain number of random numbers. 
>> This is easy, I can repeatedly do uniform(0, 1) for 


> > example. 


> > But, I want the random numbers just generated sum up 
D> tol. 


> > I am not sure how to do this. Any idea? Thanks. 





2 
^ import random 


> def partition(start-0, stop-1, eps-5) : 

Dd = stop - start 

\vals = [ start + d * random. random() for | in range (2*eps) J 
vals = [start] + vals + [stop] 

vals. sort () 

2return vals 


^ P = partition?) 
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^ intervals = [ P[i:i*2] for i in range(len(P)-1) J 





> deltas = [ x[1] - x[0] for x in intervals / 


2 print deltas 


^ print sum(deltas) 
> 





def partition (N=5): 

vals = sorted( random. random() for | in range (2#N) ) 
vals 10) + vals + [1] 

for j in range (Z*N*1) : 

yield vals[j:jt2] 


deltas = [ x[1]-x[0/ for x in partitionQ J 

print deltas 

print sum(deltas) 
/0. 10271966686994982, 0. 13826576491042208, 0. 064146913555132801, 
0. 11906452454467387, 0. 10501198456091299, 0. 011732423830766779, 
0. 11785369256442912, 0. 065927165520102249, 0. O983513058 78176198, 


0. 077786747076205365, 0. 099139810689226726] 
1.0 











当然 ， 由 于 新 文章 不 断 的 出 现 ， 输 出 经 常会 不 一 样 。 只 要 你 的 服务 器 里 一 有 文章 更 新 ， 输 出 就 
会 不 一 样 了 。 


逐 行 解释 


1-9 íF 
程序 开始 是 一 些 导 入 语句 和 常量 定义 ， 跟 FTP 客户 端 差 不 多 。 





11-40 4 

在 第 一 部 分 ， 我 们 尝试 连接 到 NNTP 服务 器 ， 如 果 失 败 就 退出 (13-24 77). 88 15 行 故意 注释 掉 
了 ， 如 果 需 要 输入 用 户 名 和 密码 进行 认证 的 话 ， 可 以 打开 这 一 行 ， 并 修改 第 14 行 。 后 面 是 尝试 读 取 
指定 的 新 闻 组 。 同 样 ， 如 果 新 闻 组 不 存在 ， 服 务 器 没有 保存 这 个 新 闻 组 ， 或 是 需要 认证 的 话 ， 退 出 
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42-55 fT 

下 面 这 一 部 分 ， 我 们 读 一 些 头 信息 ， 并 显示 出 来 (42-51 行 )。 最 有 用 处 的 头 信息 包括 作者 ， 主 
题 和 日 期 。 这 些 数据 会 被 读 取 并 显示 给 用 户 。 在 每 一 次 调用 xhdr () 方 法 时 ， 都 要 给 定 想 要 提取 信息 
头 的 文章 的 范围 。 我 们 只 想 取 一 条 信息 ， 所 以 范围 就 是 “Xx-X”， 其 中 , X 是 最 后 一 条 信息 的 号 人 码 。 









































xhdr 0 方法 返回 一 个 长 度 为 2 的 元 组 ， 包 含 了 服务 器 的 返回 信息 (rsp〉 和 我 们 指定 范围 的 信息 
头 的 列表 。 由 于 我 们 只 指定 了 一 个 消息 (最 后 一 个 )， 我 们 只 取 列 表 的 第 一 个 元 素 (hdr[0] )。 数 据 
元 素 是 一 个 长 度 为 2 的 元 组 ， 包 含 文章 写 和 数据 字符 串 。 由 于 我 们 已 经 知道 了 文章 号 (我们 在 请 求 
中 给 出 了 )， 我 们 只 关心 第 二 个 元 素 ， 数 据 字符 串 (hdr[0]11])。 











最 后 一 部 分 是 下 载 文章 的 内 容 (53-55 行 )。 先 调用 body 0 方法 , 然后 显示 前 20 个 有 意义 的 行 ， 
最 后 登 出 服务 器 ， 完 成 执行 。 


57-80 行 

主要 的 处 理 任 务 由 displayFirst20 0) 函数 完成 (57-80 行 )。 它 接受 文章 的 所 有 行 做 为 参数 ， 并 
做 一 些 预 处 理 ， 如 把 计数 器 清 0， 创 建 一 个 生成 器 表达 式 对 文章 内 容 的 所 有 行 做 一 些 处 理 ， 然 后 “ 假 
装 ” 我 们 刚 碰 到 并 显示 了 一 行 空 行 (59-61 行 ， 稍 后 细 说 )。 由 于 前 导 空 格 可 能 是 Python 代码 的 一 
部 分 ， 所 以 在 我 们 去 掉 字 符 串 中 的 空格 的 时 候 ， 只 删除 字符 串 右边 的 空格 (rstrip () )。 





















































我 们 要 做 的 是 , 我 们 不 要 显示 引用 的 文本 和 引用 文本 指示 行 。 这 就 是 65-71 行 ( 也 包含 64 47) 
的 那个 大 if 语句 所 要 做 的 事 。 如 果 这 一 行 不 是 空 行 的 时 候 ， 才 做 这 个 检查 (63 行 )。 检 查 的 时 候 ， 
会 把 字符 串 转 成 小 写 ， 这 样 就 能 做 到 比较 的 时 候 大 小 写 无 关 (64 £72. 








如 果 一 行 以 “>” 或 “|” 开 头 ， 说 明 这 一 般 是 一 个 引用 。 不 过 ， 我 们 认为 “>>>” 是 一 个 例外 ， 
因为 这 有 可 能 是 交互 命令 行 的 提示 ， 虽 然 这 样 可 能 有 问题 ， 因 为 它 也 可 能 是 一 段 被 引用 了 三 次 的 消 
E (1 段 文本 到 第 4 个 回复 的 帖子 时 被 引用 了 3 次 ) 却 被 显示 了 。 














现在 来 处 理 空 行 。 我 们 想 让 程序 聪明 一 些 ， 它 应 该 能 显示 文章 中 的 空 行 ， 但 对 空 行 的 处 理 要 做 
到 智能 。 如 果 有 多 个 连续 的 空 行 ， 则 只 显示 第 一 个 ， 这 样 用 户 不 用 看 那么 多 行 信息 ， 导 致 有 用 的 信 
息 却 在 屏幕 之 外 。 我 们 也 不 能 把 空 行 计算 到 20 行 有 意义 的 行 之 中 。 所 有 这 些 要 求 都 在 72-78 行内 实 
现 。 















































72 行 的 if 语句 表示 只 有 在 上 一 行 不 为 空 , 或 者 上 一 行为 空 但 当前 行 不 为 空 的 时 候 才 显示 。 也 就 
是 说 ， 如 果 显 示 了 当前 行 的 话 ， 就 说 明 要 么 当前 行 不 为 空 ， 要 么 当前 行为 空 但 上 一 行 不 为 空 。 这 是 
另 一 个 比较 有 技巧 的 地 方 :如 果 我 们 碰 到 了 一 个 非 空 行 ,计数 器 加 1, 并 设置 lastBlank 标志 为 False， 
以 表示 这 一 行 非 空 (74-76 行 )。 和 否则 ， 表 示 我 们 磁 到 了 空 行 ， 把 标志 设 为 True。 














现在 回 到 第 61 行 ， 我 们 设 lastBlank 标志 为 True， 是 因为 ， 如 果 内 容 的 第 一 行 实际 数据 〈 不 是 
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前 导数 据 或 是 引用 数据 ) 是 一 个 空 行 ， 我 们 不 会 显示 它 。 因 为 我 们 想 要 看 第 一 行 实际 数据 ! 








最 后 ， 如 果 我 们 已 经 显示 了 20 行 非 空 行 ， 则 退出 ， 放 弃 其 余 的 行 (79-80 行 )。 和 否则 ， 我 们 应 该 
已 经 遍历 了 所 有 行 ， 循 环 也 正常 结束 了 。 











17.3.7 NNTP 的 其 它 方面 


从 NNTP 协议 定义 /规范 CRFC 977) 中 ， 你 可 以 得 到 更 多 关于 NNTP 的 信息 : 

ftp://ftp. isi. edu/in-notes/rfc977. txt 以 及 网 页 

http://www. networksorcery. com/enp/protocol/nntp. htm。 其 它 相 关 的 RFC 1036, 2980. 
想 了 解 更 多 Python 对 NNTP 的 支持 ， 可 以 从 这 里 开始 : 

http://python. org/docs/current/lib/module-nntplib. html. 








17.4 电子 邮件 





电子 邮件 既 古 老 又 现代 。 对 于 我 们 这 些 从 很 早 就 开始 用 因特网 的 人 来 说 ，e-mail 看 上 去 是 如 此 
的 “古老 ”尤其 是 相对 于 基于 网 页 的 在 线 聊天 ， 即 时 聊天 (IM)， 和 数字 电话 即 VOIP (Voice Over 
1 Internet Protocol) 等 更 新 更 快 的 通讯 方式 来 说 更 是 如 此 。 下 一 节 中 ， 我 们 将 从 宏观 上 介绍 一 下 E 
e-mail 是 如 何 工 作 的 。 如 果 你 已 经 对 此 相当 了 解 ， 只 想 看 如 何 用 Python 做 e-mail 相关 的 开发 ， 你 
T 可 以 跳 到 后 续 章节 。 

















在 看 e-mail 的 底层 的 结构 之 前 ， 你 有 没有 问 过 自己 ，e-mail 的 确切 定义 到 底 是 什么 ?根据 RFC 
2822,“ 消 息 由 头 域 〈 合 起 来 叫 消息 头 ) 以 及 后 面 可 选 的 消息 体 组 成 * 对 于 一 般 用 户 来 说 ， 一 说 起 
e-mail 就 会 让 我 们 想到 它 的 内 容 ， 不 管 它 是 一 封 真 的 邮件 还 是 一 封 不 请 自 来 的 商业 广告 〈 即 spam, 
垃圾 邮件 )， 都 应 该 有 内 容 。 不 过 ，RFC 规定 ， 邮 件 体 是 可 选 的 ， 只 有 邮件 头 是 必要 的 。 这 一 点 要 特 
别 注意 。 























17.4.1 E-mail 系统 组 件 和 协议 


不 管 你 是 怎么 样 想 的 ， 电 子 邮 件 (e-mail) 实际 上 在 现代 的 因特网 出 现 之 前 就 已 经 出 现 了 。 它 一 
开始 用 于 mainframe 的 用 户 之 间 简 单 的 交换 信息 。 注 意 ， 由 于 他 们 都 在 使 用 同一 台电 脑 ， 所 以 ， 这 
里 甚至 都 没有 涉及 到 网 络 。 后 来 ， 当 网 络 成 为 现实 的 时 候 , 用 户 就 可 以 在 不 同 的 主机 之 间 交 换 信息 。 
当然 ， 由 于 用 户 使 用 着 不 同 的 电脑 ， 电脑 之 间 使 用 着 不 同 的 协议 , 信息 交换 成 了 一 个 很 复杂 的 概念 。 
直到 20 世纪 80 年 代 ， 因 特 网 上 用 e-mail 进行 信息 交换 才 有 了 一 个 事实 上 的 统一 的 标准 。 






































在 深入 细节 之 前 ， 我 们 移 问 问 自己 ，e-mail 是 怎么 工作 的 ? 一 条 消息 是 如 何 从 发 件 人 那 通过 洗 
瀚 的 因特网 ， 到 达 收 件 人 的 ?简单 点 来 说 ， 有 一 台 发 送 电 脑 ( 发 件 人 的 消息 从 这 里 发 送出 去 )， 和 一 
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台 目的 电脑 〈 收 件 人 的 信件 服务 器 )。 最 好 的 解决 方案 是 发 送 电脑 知道 如 何 连接 到 接收 电脑 ， 这 样 一 
来 ， 它 就 可 以 直接 把 消息 发 送 过 去 。 不 过 ， 实 际 上 一 般 并 不 这 么 顺利 。 








发 送 电 脑 要 查询 到 茶 一 台中 间 主 机 ， 这 台中 间 主 机 能 到 达 最 后 的 收 件 主机 。 然 后 这 人 台中 间 主 机 
要 找 一 台 离 目的 主机 更 近 一 些 的 主机 。 所 以 ， 在 发 送 主机 和 目的 主机 之 间 ， 可 能 会 有 多 人 台 叫 做 “ 跳 
板 ” 的 主机 。 如 果 你 仔细 看 看 你 收 到 的 e-mail 的 邮件 头 ， 你 会 看 到 一 个 “passport ”标记 ， 其 中 记 
录 了 邮件 寄 给 你 这 一 路 上 都 到 过 了 哪些 地 方 。 











为 了 让 描述 清楚 一 些 ， 证 我 们 先 看 看 e-mail 系统 的 各 个 组 件 。 最 主要 的 组 件 是 消息 传输 代理 
CMTIA)。 这 是 一 个 在 邮件 交换 主机 上 运行 的 一 个 服务 器 程序 ， 它 负责 邮件 的 路 由 ， 队 列 和 发 送 工作 。 
它们 就 是 邮件 从 源 主 机 到 目的 主机 所 要 经 过 的 跳板 。 所 以 也 被 称 为 是 “信息 传输 ”的 “代理 ” 
































要 让 所 有 这 些 工作 起 来 ，MTA 要 知道 两 件 事情 : D 如 何 找到 消息 应 该 去 的 下 一 台 MTA 2) 如 何 
与 另 一 台 MTA 通讯 。 第 一 件 事 由 域名 服务 ONS) 来 查找 目的 域名 的 M CHB RAS He Mail eXchange) 
来 完成 。 这 对 于 最 后 的 收 件 人 是 不 必要 的 ， 但 对 其 它 的 跳板 来 说 ， 则 是 必要 的 。 对 于 第 二 件 事 ，MTA 
怎么 把 消息 转 给 其 它 的 MTA 呢 ? 














17.4.2 AIF E-mail 











要 能 发 送 e-mail， 你 的 邮件 客户 端 一 定 要 连接 到 一 个 MTA, EMTS ET. MTA 之 
间 通 讯 所 使 用 的 协议 叫 消息 传输 系统 MTS)。 只 有 两 个 MTA 都 使 用 这 个 协议 时 ， 才 能 进行 通讯 。 在 
本 节 开 始 时 就 说 过 ， 由 于 以 前 存在 很 多 不 同 的 计算 机 系统 ， 每 个 系统 都 使 用 不 同 的 网 络 软 件 ， 这 种 
通讯 很 危险 ， 具 有 不 可 预知 性 。 更 复杂 的 是 ， 有 的 电脑 使 用 互 连 的 网 络 ， 而 有 的 电脑 使 用 调制 解 调 
器 拨号 ， 消 息 的 发 送 时间 也 是 不 可 预知 的 。 事 实 上 ， 笔 者 曾经 有 一 封 邮件 在 发 送 9 个 月 后 才 收 到 ! 
互连网 的 速度 怎么 会 这 么 慢 ? 出 于 对 这 些 复 杂 度 的 考虑 ， 现 代 e-mail 的 基础 之 一 ， 简 单 邮 件 传输 协 
i (SMTP) 于 1982 年 出 现 了 。 





























SMTP 











SMTP 由 已 故 的 Jonathan Postel (加利福尼亚 大 学 信息 学 院 ) 创建 ， 记 录 在 RFC 821 F, F 
1982 年 8 月 公布 。 其 后 的 修改 记录 在 RFC 2821 中 ， 于 2001 年 4 月 公布 。 一 些 已 经 实现 了 SMTP 
的 著名 MTA 包括 : 





开源 MTA 

€ Sendmail 
€ Postfix 
e Exim 
e 


qmail (免费 发 布 ， 但 不 开源 ) 
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商业 MTA 
@ Microsoft Exchange 
€ lotus Notes Domino Mail Server 








， 虽 然 它 们 都 实现 了 RFC 2821 中 定义 的 最 小 化 SMTP 协议 ， 它 们 中 的 大 多 数 ， 尤 其 是 一 些 
M n. 都 在 服务 器 中 加 入 了 协议 定义 之 外 的 特有 的 功能 





SMTP 是 在 因特网 上 MTA 之 间 用 于 消息 交换 的 最 常用 的 MTS。 它 被 MTA 用 来 把 e-mail 从 一 台 主 机 
传送 到 另 一 台 主 机 。 在 你 发 e-mail 的 时 候 ， 你 必须 要 连接 到 一 个 外 部 的 SMTP 服务 器 ， 这 时 ， 你 的 
邮件 程序 是 一 个 SMTP 客户 端 。 你 的 SMTP 服务 器 也 因此 成 为 了 你 的 消息 的 第 一 个 跳板 。 








17. 4. 3 Python 和 SMTP 





是 的 ， 也 存在 一 个 smtplib 模块 和 一 个 smtplib. SMTP 类 要 实例 化 。 再 来 看 看 这 个 已 经 熟悉 的 过 
程 吧 : 





1. ”连接 到 服务 器 


2. ”登录 (如 果 需 要 的 话 ) 
3. ”发 出 服务 请 求 
4. 退出 


像 NNTP —¥€, € 登录 是 可 选 的 ， 只 有 在 服务 器 打开 了 SMTP 认证 CSMTP-AUTH) 时 才 要 登录 。SMTP-AUTH 
在 RFC 2554 中 定义 。 还 是 跟 NNTP 一 样 ，SMTP 通讯 时 ， 只 要 一 个 端口 25。 























下 面 是 一 些 Python 的 伪 代 码 : 
from smtplib import SMTP 
n = SMIP( smtp. yourdomain. com’ ) 


M ET tO 


在 看 真实 的 例子 之 前 ， 我 们 要 先 介绍 一 下 smtplib. SMTP 类 的 一 些 常用 的 方法 。 











17.4.4 smtplib. SMTP 类 方法 














跟 之 前 一 样 ， 我 们 会 列 出 smtplib. SMTP 类 的 方法 ， 但 不 会 列 出 所 有 的 方法 ， 只 列 出 你 创建 SMTP 
客户 端 程序 所 需要 的 方法 。 对 大 多 数 e-mail 发 送 程序 来 说 ， 只 有 两 个 方法 是 必须 的 : sendmail () 和 
quit(). 
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sendmailO 的 所 有 参数 都 要 遵循 RFC 2822, BI e-mail 地 址 必须 要 有 正确 的 格式 ， 消 息 体 要 
角 的 前 导 头 ， 前 导 头 后 面 是 两 个 回 车 和 换行 (\r\n) 对 。 






































zu 























Bl *Date:" AI *From:": (MAIL FROM, RCPT TO, DATA) 





还 有 一 些 方法 没有 被 提 到 ， 不 过 ， 一 般 来 说 ， 它 们 不 是 发 送 e-mail 所 必须 的 。 请 参考 Python 
文档 以 获取 SMTP 对 象 的 所 有 方法 的 信息 。 











表 17.3 SMTP 对 象 的 方法 

















方法 描述 

Sendmail 

(from, to, msgl, 

mopts, ropts]) JU msg 从 from 发 送 给 to《〈 列 表 或 元 组 )。ESMTP 设置 Cnopts) 和 收 
件 人 设置 (ropts) 为 可 选 。 

quit Q 关闭 连接 ， 然 后 退出 





login(user, passwd)* 使 用 user 用 户 和 passwd 密码 登录 到 SMTP 服务 器 


a， 只 在 有 SMTP-AUTH 时 使 用 。 
17. 4.5 交互 式 SMTP 示例 


同样 地 ， 我 们 先 给 一 个 交互 式 的 例子 : 


222 from smtplib import SMTP as smtp 

2» s = smtp( smtp. python. is. cool’) 

225 s. set debuglevel (1) 

2225 s. sendmail C wesley@python. is. cool’, C wesley@python. is. cool’, 


232 


"chunÜpython. is. cool’), From: wesley@python. is. cool |r|nTo: 
wesley@python. is. cool, chun@python. is. cool |r|nSubject: test 
msg\r\n\r\nxxx\r\n. ’’’) 

send: 'ehlo myMac. local\r\n’ 

reply: '250-python. is. cool\r\n’ 

reply: '250-7BIT|r|n' 

reply: '250-SBITMIME|r|n* 

reply: '250-AUTH CRAM-MD5 LOGIN PLAIN\r\n’ 

reply: '250-DSN|r|n' 

reply: '250-EXPW|r|n' 
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reply: '250-HELP|r|n' 
reply: '250-NO0P|r|n' 
reply: '250-PIPELINING|r|n* 
reply: '250-SIZE 15728640|r|n' 
reply: '250-STARTTLS |r|n* 
reply: '250-VERS V05. 00c++\r\n’ 
reply: '250 XMVP 2\r\n’ 
reply: retcode (250); Msg: python. is. cool 
/BIT 

SBITMIME 
AUTH CRAM-MD5 LOGIN PLAIN 
DSN 
EXPN 
HELP 
NOOP 
PIPELINING 
SIZE 15728640 
STARTTLS 

VERS V05. 00c++ 

XMVP 2 

send: 'mail FROM: <wesley@python. is. cool^ size-108|r|n' 
reply: '250 ok\r\n’ 
reply: retcode (250); Msg: ok 
send: 'rcpt T0:<wesley@python. is. cool^|r|n' 
reply: '250 ok|r|n' 
reply: retcode (250); Msg: ok 
send: 'datalr|n 
reply: '354 ok|r|n' 
reply: retcode (354); Msg: ok 

data: (3854, ok’) 
send: 'From: wesley@python. is. cool |r|nTo: 





wesley@python. is. cool |r|nSubject: test 

msg\r\n\r\nxxx\|r\|n.. ria. \r\n’ 

reply: '250 ok ; id-20051226235837013000r7hhe \r\n’ 

reply: retcode (250); Msg: ok ; id-20051226235837013000r7hhe 
data: (250, 'ok ; id-2005122623583701300or7hhe' ) 

( 

2 s. quit 

send: 'quit|r|n' 

reply: '221 python. is. cool\r\n’ 
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reply: retcode (221); Msg: python. is. cool 





17.4.6 SMTP 的 其 它 方 面 


从 SMTP 协议 定义 / 规范 (RFC 2821) 中 ， 你 可 以 得 到 更 多 关于 SMTP 的 信息 : 
ftp://ftp. isi. edu/in-notes/rfc2821. txt 以 及 网 页 

http://www. networksorcery. com/enp/protocol/smtp. htm. 

想 了 解 更 多 Python 对 SMTP 的 支持 ， 可 以 从 这 里 开始 : 

http://python. org/docs/current/lib/module-smtplib. html. 














我 们 还 没有 讨论 的 e-mail 的 一 个 很 重要 的 方面 是 怎么 正确 的 设 定 因特网 地 址 的 格式 和 e-mail 
消息 。 这 些 信息 详细 记录 在 因特网 信息 格式 RFC 2822 中 。 可 以 在 
ftp://ftp. isi. edu/in-notes/rfc2822. txt 下 载 。 

















17.4.7 接收 E-mail 





在 以 前 ， 在 因特网 上 用 e-mail 通讯 的 只 有 大 学 学 生 ， 研 究 人 员 和 工商 企业 的 雇员 。 桌 面 电脑 还 
1 都 是 类 Unix 操作 系统 。 家 庭 用 户 只 是 拨号 到 PC 上 ， 并 不 真 的 使 用 e-mail。 在 20 世纪 90 年 代 中 期 
T 因特网 大 爆炸 的 时 候 ，e-mail BEA Y FRAP. 











对 于 家 族 用 户 来 说 ， 在 家 里 放 一 个 工作 站 来 运行 SMTP 是 不 现实 的 。 必 须要 设计 一 种 新 的 系统 ， 
能 够 周期 性 地 把 信件 下 载 到 本 地 计算 机 ， 以 供 离线 时 使 用 。 这 样 的 系统 就 要 有 一 套 新 的 协议 和 新 的 
应 用 程序 来 与 邮件 服务 器 通讯 。 




















在 家 用 电脑 中 运行 的 应 用 程序 叫 邮件 用 户 代 理 MUA. MUA 从 服务 器 上 下 载 邮 件 ， 在 这 个 过 程 中 
可 能 会 自动 删除 它们 《〈 也 可 能 不 删除 ， 留 在 服务 器 上 ， 让 用 户 手 动 删除 )。 不 过 ，MUA 也 必须 要 能 发 
送 邮件 。 也 就 是 说 ， 在 发 送 邮件 的 时 候 ， 它 要 能 直接 与 MTA 用 SMTP 进行 通讯 。 在 前 面 讲 SMTP 的 章 
节 中 ， 我 们 已 经 看 过 这 种 客户 端 了 。 那 下 载 邮件 的 呢 ? 











17.4.8 POP 和 IMAP 


用 于 下 载 邮 件 的 第 一 个 协议 叫 邮局 协议 ， 记 录 在 RFC 918 中 ， 于 198442 10 月 公布 。“ 邮 局 协议 
(POP) 的 目的 是 让 用 户 的 工作 站 可 以 访问 邮箱 服务 器 里 的 邮件 。 邮 件 要 能 从 工作 站 通过 简单 邮件 传 
输 协 议 (SMTP) 发 送 到 邮件 服务 器 >”。POP 协议 的 最 新 版 本 是 第 3 版 ， 也 叫 POP3。 
POP3 在 RFC 1939 中 定义 ,至今 为 止 仍 在 被 广泛 地 使 用 ,也 是 我 们 下 面 的 客户 端 例子 的 主要 内 容 。 




















在 POP 之 后 几 年 , 出 现 了 另 一 个 协议 , 叫 交 互 式 邮 件 访 问 协 议 CMAP). 第 一 个 版 本 是 实验 性 的 ， 
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直到 第 2 版 时 ， 其 RFC 1064 才 在 1988 年 被 公布 。 现 在 被 使 用 的 IMAP 版 本 是 IMAP4rev1， 它 也 被 广 
泛 地 使 用 。 事 实 上 ， 当 今世 界 上 占有 邮件 服务 器 大 多 数 市 场 的 Microsoft Exchange 就 使 用 IMAP 作 
为 其 下 载 机 制 。IMAP4revl 协议 定义 在 RFC 3501, F 2003 年 3 月 公布 。IMAP 的 目的 是 要 提供 一 个 更 
全 面 的 解决 方案 。 不 过 ， 它 比 POP 更 为 复杂 。 对 IMAP 的 进一步 讨论 超出 了 本 章 剩余 部 分 的 范围 。 我 
们 建议 感 兴趣 的 用 户 参考 上 述 RFC 文档 。 图 17-3 展示 的 复杂 系统 就 是 我 们 所 认为 的 简单 的 e-mail。 
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d e. POPSIMAPA 
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图 17-3 因特网 上 的 E-Mail 发 件 人 和 收 件 人 。 客 户 端 通过 他 们 的 MUA 和 相应 的 MTA 进行 通讯 ， 
来 下 载 和 发 送 邮 件 。E-Mail 从 一 个 MTA“ 跳 ”到 另 一 个 MTA， 直 到 到 达 目 的 地 为 止 。 


17. 4. 9 Python 和 POP3 


BAAR, FATE: 导入 poplib， 实 例 化 poplib. POP3 25. 
标准 的 做 法 如 下 : 


连接 到 服务 器 
登录 
发 出 服务 请 求 
退出 


e meg 


Python 的 伪 代 码 如 下 : 


from poplib import POP3 

p = POP3( pop. python. is. cool’) 
p. üsarC..J 

p. pass. (...) 


p. quit?) 


在 看 真实 的 例子 之 前 ， 我 们 要 先 看 一 个 交互 式 的 例子 以 及 介绍 一 下 poplib.POP3 类 的 一 些 基 本 
的 方法 。 








和 aa + 
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17. 4. 10 交互 式 POP3 举例 





下 面 是 使 用 Python poplib 模块 的 交互 式 的 例子 : 


>>> from poplib import POP3 
22^ p = POP3( pop. python. is. cool’) 
2> p. user ( techNstuff4U' ) 
^ ore 
2> p.pass ( notMyPasswd' ) 
Traceback (most recent call last): 
File “<stdin>”, line L in ? 
File “/usr/local/lib/python2, 4/poplib.py/, line 202, 
in pass 
return self. shortcmd( PASS %s’ % pswd) 
File “/usr/local/lib/python2. 4/poplib.py/, line 165, 
in shortcmd 
return self. getresp() 
File “/usr/local/lib/python2, 4/poplib.py/, line 141, 
in _getresp 
raise error proto (resp) 
poplib.error proto: -ERR directory status: BAD PASSWORD 
22» p. user ( techNstuff4U' ) 
^ gre 
2> p.pass ( youllNeverGuess’ ) 
"10K ready’ 
222 p. stat 0 
(102, 2023455) 
2M» rsp, msg, siz = p. retr (102) 
222^ rsp, Siz 
C*0OK', 480) 
222 for eachLine in msg: 
. print eachLine 


Date: Mon, 26 Dec 2005 23:58:38 +0000 (GMT) 
Received: from c-42—-32-25-43. smtp. python. is. cool 
by python. is. cool (scmrch31) with ESMTP 

id «20051226235837013000r7/hhe»; Mon, 26 Dec 2005 
23:88:37 +0000 
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From: wesley@python. is. cool 





To: wesley@python. Is. cool 
Subject: test msg 
XXX 


222 p. quit 0 
"10K python. is. cool’ 


17. 4. 10 poplib. POP3 类 方法 








POP3 类 有 无 数 的 方法 来 帮助 你 下 载 和 离线 管理 你 的 邮箱 。 最 常用 的 列 在 表 17.4 中 。 




















表 17.4 POP3 对 象 的 常用 方法 














方法 描述 

user (login) 发 送 用 户 名 login 到 服务 器 , 并 等 候 服务 器 的 正在 等 竺 用户 密码 的 返回 信息 

pass (passwd) 发 送 密码 passwd (在 使 用 user O 登录 之 后 使 用 )。 een 引发 一 
个 异常 

stat () 返回 邮件 的 状态 ， 一 个 长 度 为 2 的 元 组 (msg ct, mbox siz): 消息 的 数 





量 和 消息 的 总 大 小 也 即 字 节 数 
list ([msgnum]) stat O 的 扩展 , 从 服务 器 返回 长 度 为 3 的 元 组 的 消息 列表 (rsp, msg_list,， 
rsp_siz): 服务 器 的 返回 信息 ， 消 息 的 列表 ， 返 回信 息 的 大 小 。 如 果 给 
J msgnum 的 话 ， 只 返回 指定 消息 的 数据 。 
retr (msgnum) 从 服务 器 中 得 到 消息 msgnum， 并 设置 其 “已 读 ” 标志。 返回 一 个 长 度 为 
3 的 元 组 (rsp, msglines, msgsiz): 服务 器 的 返 回信 息 ， 消息 msgnum 
的 所 有 行 ， 消 息 的 字 节 数 
dele (msgnum) 把 消息 msgnum 标记 为 删除 , 大 多 数 服 务 器 在 调用 quit O 后 执行 删除 操作 。 
quit () 登 出 ， 保 存 修改 〈 如 ， 执 行 “ 已 读 ” 和 “删除 ”标记 等 )， 解 锁 邮 箱 ， 
结束 连接 ， 然 后 退出 


























在 登录 时 , user 0 方法 不 仅 向 服务 器 发 送 了 用 户 名 ， 也 要 等 待 服务 器 正在 等 得 用 户 密码 的 返回 信 
。 如 果 pass_0 〇 方法 认证 失败 ， 会 引发 一 个 poplib. error proto 的 异常 
如 果 成 功 ， 会 得 到 一 个 以 '+ 号 开头 的 返回 信息 ， 如 “+OK ready”, 然后 服务 器 上 的 该 最 月 就 被 
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调用 list HHT, msg list 的 格式 为 : [ ‘msgnum msgsiz' ,:-s], HH, msgnum 和 msgsiz 
分 别 是 每 个 消息 的 编号 和 消息 的 大 小 。 


锁定 了 ， 直 到 调用 了 quit 0 方法 为 止 。 




















5 








还 有 一 些 方法 未 被 列 出 ， 想 要 了 解 更 多 信息 ， 请 参考 Python 手册 里 poplib 的 文档 。 


17.4.12 客户 端 程序 SMTP 和 POP3 举例 





下 面 的 例子 演示 了 如 何 使 用 SMTP 和 POPS 来 创建 一 个 既 能 接收 和 下 载 e-mail 也 能 上 传 和 发 送 
e-mail 的 客户 端 。 我 们 将 要 先 用 SMTP 发 一 封 e-mail 给 自己 (或 其 它 测试 帐户 )， 等 待 一 段 时 间 一 一 
我 们 随便 选 了 一 个 时 间 ，10 秒 钟 一 一 然后 使 用 POP3 下 载 这 封 e-mail， 下 载 下 来 的 内 容 跟 发 送 的 内 
容 应 该 是 完全 一 样 的 。 如 果 程 序 悄 无 声息 地 结束 ， 没 有 输出 也 没有 异常 ， 那 就 说 明 我 们 的 操作 都 成 
Zl. 
































例 17. 3 SMTP 和 POP3 示例 (myMail. py) 


这 个 脚本 《〈 通 过 SMTP 邮件 服务 器 ) 发 送 一 封 测试 e-mail 到 目的 地 址 ， 并 蕊 上 (通过 PoP) 把 
e-mail 从 服务 器 上 收回 来 。 要 让 程序 能 正常 工作 ， 你 需要 修改 服务 器 的 名 字 和 e-mail 的 地 址 。 

















7 #!//usr/bin/env python 
2 
3 from smtplib import SMTP 
4 from poplib import POP3 
5 from time import sleep 
6 
7 SMTPSVR = ° smtp. python. is. cool’ 
8 POP3SVR = 'pop. python. is. cool’ 
9 
10 origHdrs = [’From: wesley@python. is. cool’, 
11 'To: wesley@python. is. cool’, 
12 'Subject: test msg’ J 
13 origBody = [’xxx’, 'yyy , "222 ] 
14 origMsg = \r\n\r\n’. join(l[ \r\n’. join (origHdrs), 
"Iran. join (origBody) J) 
15 
16 sendSvr = SMTP (SMTPSVR) 
17 errs = sendSvr. sendmail ( wesley@python. is. cool’, 
18 (wesley@python. is. cool’,), origMsg) 





$— 一 * 一 
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19 sendSvr. quit () 





20 assert len(errs) == 0, errs 
21 sleep(10) # wait for mail to be delivered 
22 


23 recvSvr = POP3(POP3SVR) 

24 recvSvr. user ( wesley’) 

25 recvSvr. pass ( youllNeverGuess’ ) 

26 rsp, msg, siz = recvSvr. retr(recvSvr. stat 0) [0]) 
27 # strip headers and compare to orig msg 

28 sep = msg. index C’) 

29 recvBody = msgísep*1:/ 

30 assert origBody == recvBody # assert identical 


逐 行 解 释 
1-8 47 


跟 本 章 前 面 的 例子 一 样 ， 程 序 一 开始 是 一 些 导入 语句 和 和 常量 的 定义 。 常 量 分 别 是 发 送 邮件 和 接 
收 邮件 的 服务 器 。 























10-14 íF 

这 几 行 是 消息 内 容 的 准备 工作 。 这 里 ， 我 们 放 了 三 行 消息 头 然 后 是 消息 体 。From 和 To 两 个 头 
分 别 表示 消息 的 发 件 人 和 收 件 人 。14 行 把 消息 头 和 消息 体 放 在 一 起 组 成 一 个 可 以 发 送 的 消息 ， 按 
RFC 2822 的 要 求 ， 这 两 部 分 用 空 行 隔 开 。 











16-21 行 

我 们 连接 到 发 送 CSMTP) 服务 器 来 发 送 我 们 的 消息 。 这 里 还 有 一 对 From 和 To 的 地 址 ， 这 些 地 
址 是 “真实 ”的 e-mail 地 址 ， 或 者 说 是 信封 格式 (envlelope) 的 地 址 。 收 件 人 参数 应 该 是 一 个 可 和 迭 
代 的 对 象 ， 如 果 传 的 是 一 个 字符 串 ， 就 会 被 转 成 一 个 只 有 一 个 元 素 的 列表 。 不 请 上 自 来 的 垃圾 邮件 中 ， 
消息 头 和 信封 头 总 是 不 一 致 的 。 




















sendmail 0 的 第 三 个 参数 是 e-mail 信息 本 喘 。 这 个 函数 返回 之 后 ， 我 们 就 登 出 SMTP 服务 器 ， 
并 判断 是 否 有 错误 发 生 过 。 我 们 要 等 竺 一段 时 间 ， 等 待 服务 器 完成 消息 的 发 送 与 接收 。 








23-30 行 

程序 的 最 后 一 部 分 是 下 载 刚刚 发 送 的 消息 ， 并 断言 发 送 的 和 接收 的 消息 是 完全 一 样 的 。 先 给 出 
用 户 名 和 密码 ， 连 接 到 POPS 服务 器 ， 在 登录 成 功 后 ， 调 用 stat 0 方法 得 到 有 效 的 消息 的 列表 。 我 们 
先 选 第 一 条 消息 ([0]) ， 然 后 调用 retr () 下 载 这 个 消息 。 




















我 们 用 空 行 来 分 隔 头 和 信息 ， 去 掉头 部 分 ， 比 较 原 始 信息 体 和 收 到 的 信息 体 。 如 果 它 们 相同 ， 
什么 都 不 显示 ， 程 序 正常 退出 ， 和 否则 ， 会 出 现 一 个 断言 失败 的 错误 。 
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由 于 错误 的 类 型 太 多 ， 我 们 在 这 个 脚本 里 不 做 错误 检查 ， 这 样 的 好 处 是 你 可 以 直接 看 到 出 现 了 
什么 错误 。 在 本 章 末 尾 有 一 个 习题 就 是 做 错误 检查 的 。 











现在 , 你 对 如 何 发 送 和 接收 e-mail 有 了 一 个 很 全 面 的 了 解 。 如 果 你 想 深 入 了 解 这 一 方面 的 编程 ， 
请 参阅 下 一 章 里 介绍 的 e-mail 相关 的 模块 ， 它 们 在 程序 开发 方面 有 相当 大 的 帮助 。 











17. 5 相关 模块 


Python 最 好 的 一 个 方面 就 是 它 在 标准 库 中 提供 了 相当 的 全 面 的 网 络 支 持 。 尤 其 在 因特网 协议 和 
客户 端 开发 方面 的 支持 更 为 全 面 。 下 面 列 出 了 一 些 相关 模块 ， 首 先是 电子 邮件 相关 的 ， 随 后 是 一 般 
用 途 的 因特网 协议 相关 的 。 





17.5.1 E-mail 





Python 自 带 了 很 多 e-mail 模块 和 包 可 以 帮助 你 创建 应 用 程序 。 表 17. 5 中 列 出 了 一 部 分 。 


表 17.5 E-Mail 相关 模块 


模块 / 包 描述 . 
email e-mail 处 理 的 包 〈 也 支持 MIME) 












































rfc822 RFC2822 邮件 头 解析 器 

smtpd SMTP 服务 器 

base64 Base 16，32， 和 64 数据 编码 (RFC 3548) 

mhlib 处 理 MH RAE WIZ 

mailbox 文 持 mailbox 文件 格式 解析 的 类 

mailcap “mailcap” 文件 的 处 理 模 块 

mimetools 《不 建议 使 用 ) MIME 信息 解析 工具 〈 使 用 上 面 的 email) 
mimetypes 在 文件 名 或 URL 到 相关 的 MIME 类 型 之 间 转 换 的 模块 
MimeWriter (不 建议 使 用 ) MIME 信息 处 理 模块 〈 使 用 上 面 的 email) 
mimify (不 建议 使 用 ) 信息 的 MIME 处 理工 具 《〈 使 用 上 面 的 email) 
binascii 二 进 制 和 ASCII 转换 

binhex Binhex4 编码 和 解码 支持 


17. 5. 2 其 他 网 络 协议 


表 17.6 因特网 协议 相关 的 模块 
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模块 描述 

ftplib FTP 协议 客户 端 
gopherlib Gopher 协议 客户 端 
httplib HTTP 和 HTTPS 协议 客户 端 
imaplib IMAP4 协议 客户 端 








nntplib NNTP protocol client 
nntplib NNTP 协议 客户 端 
poplib POP3 协议 客户 端 





smtplib SMTP 协议 客户 端 
telnetlib Telnet 协议 客户 端 类 


17.6 练习 


FTP 


17-1. 简单 FTP 客户 端 。 参考 本 章 的 FTP 例子 ， 写 一 个 小 的 FTP 客户 端 程序 ， 能 够 去 你 喜欢 的 
网 站 下 载 你 使 用 的 软件 的 最 新 版 本 。 这 个 脚本 应 该 每 几 个 月 就 运行 一 次 ， 以 确保 你 在 用 的 软件 是 “最 
新 和 最 好 的 ”。 你 应 该 把 FTP 地 址 ， 登 录 信 息 放 在 一 个 表 里 ， 省 得 每 次 都 要 修改 。 



































17-2. 简单 FTP 客户 端 和 模式 匹配 。 在 上 一 个 练习 的 基础 上 创建 一 个 新 的 FTP 客户 端 程序 。 
它 可 以 上 传 和 下 载 指定 模式 的 文件 。 比 方 说 ， 如 果 想 把 一 些 Python 的 文件 和 PDF 文件 从 一 台电 脑 
传 到 另 一 台电 脑 上 ， 那 用 户 可 以 输入 “*. py” W “docx. pdf ”， 程 序 会 只 传 这 些 文 件 名 匹配 的 文件 。 

















17-3. ”智能 FTP 命令 行 客户 端 程序 。 创 建 一 个 跟 Unix 下 /bin/ftp 类 似 的 命令 行 下 的 FTP 程序 ， 
不 过 ， 这 个 FTP 客户 端 要 更 好 一 些 ， 能 提供 更 有 用 的 功能 。 你 可 以 看 看 http://ncftp. com 的 ncFTP 
做 为 样板 。 它 有 以 下 功能 : 历史 记录 ， 书 签 〈 可 以 保存 FTP 地 址 和 登录 信息 )， 下 载 进度 显示 等 。 你 
可 以 使 用 readline 来 记录 历史 命令 ， 用 curses 来 控制 屏幕 。 




















17-4. FIP 和 多 线程 。 创 建 一 个 能 使 用 Python 的 线程 库 下 载 文件 的 FTP 客户 端 程序 。 你 可 以 通 
过 修改 上 一 个 练习 的 程序 或 者 重 写 一 个 简单 的 客户 端 来 下 载 文件 。 你 可 以 在 命令 行 参数 里 指定 要 下 
载 的 文件 , 也 可 以 做 一 个 GUI, 在 界面 中 让 用 户 选择 要 下 载 的 文件 。 附 加 题 : 要 能 支持 模式 ， 如 #. exe. 
要 使 用 不 同 的 线程 来 下 载 每 个 文件 。 

















17-5. FTP 和 GUI。 在 你 上 面 写 的 FTP 客户 端 程序 中 加 入 GUI， 让 你 的 程序 成 为 一 个 完整 的 FTP 
应 用 程序 。 你 可 以 使 用 Python 的 任何 GUI 工具 包 。 





17-6. FM. M ftplib. FTP 派生 出 一 个 类 FTP2, 在 这 个 类 中 ， 你 不 用 像 之 前 那 4 个 retr*0 
和 store () 方 法 中 那样 要 给 定 “STOR filename" 或 “RETR filename” 这 样 的 命令 。 只 要 传 文件 名 
就 好 了 。 你 可 以 重 写 已 有 的 方法 也 可 以 在 方法 后 加 一 个 2， 如 retrlines20. 
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Python 发 布 包 中 有 一 个 Tools/scripts/ftpmirror.py 脚本 ， 它 使 用 ftplib 模块 ， 可 以 对 整个 
FTP 站 点 或 FTP 站 点 的 一 部 分 做 镜像 。 它 可 以 做 为 ftplib 模块 应 用 的 扩展 例子 来 使 用 。 解 答 下 面 5 
个 问题 时 , 可 以 参考 这 个 脚本 。 你 可 以 直接 使 用 ftpmirror. py 里 的 代码 , 也 可 以 以 这 个 脚本 为 样板 ， 
自己 重新 写 一 个 。 














17-7. 递归 。ftpmirror. py 脚本 递归 的 复制 一 个 远程 的 目录 。 写 一 个 与 ftpmirror. py 相似 的 
脚本 ， 它 的 默认 行为 是 不 递归 的 。 只 有 在 传 入 了 “-r” 参 数 的 时 候 ， 才 递归 的 把 文件 复制 到 本 地 目 
录 。 





17-8. 模式 匹配 。ftpmirror. py 脚本 支持 “-s” 参 数 让 用 户 指定 能 匹配 模式 的 文件 不 下 载 ， 如 
“x exe", 重新 写 一 个 简单 的 FTP 客户 端 程序 或 修改 之 前 的 程序 ， 实 现 让 用 户 指定 通配符 ， 程 序 只 
下 载 能 匹配 模式 的 文件 。 可 以 在 你 之 前 练习 的 答案 基础 上 实现 。 














17-9. ”递归 和 模式 匹配 。 写 一 个 FTP 客户 端 程序 ， 把 上 面 两 个 练习 的 脚本 集成 在 一 起 。 


17-10. 递归 和 ZIP 文件 。 这 个 练习 与 上 面 的 第 一 个 递归 练习 有 些 相似 ， 只 是 不 再 直接 把 文件 
下 载 到 本 地 文件 系统 ， 而 是 文件 下 载 后 压缩 到 一 个 ZIP CHR TGZ, BR BZ2) 文件 中 。 同 样 ， 你 可 以 在 
之 前 脚本 的 基础 上 改 ， 也 可 以 重 写 一 个 。 使 用 “-z” 参 数 让 用 户 可 以 自动 地 备份 一 个 FTP 站 点 。 














17-11. 集成。 实现 一 个 最 终 的 , 全 功能 的 FTP 应 用 程序 , 包含 上 面 几 个 练习 的 所 有 功能 。 即 ， 
支持 “y” “g” 和 «ou» 参数 。 


NNTP 


17-12. NNTP 介绍 。 修 改 例 17. 2(getLatestNNTP. py) ， 让 它 显示 第 一 封 ( 而 不 是 最 后 一 封 ) 有 
效 文 章 的 有 意义 的 内 容 。 





17-13. 代码 改进 ,修正 getLatestNNTP. py 的 会 输出 3 次 引用 问题 ,这 是 因为 我 们 想 输 出 Py thon 
交互 解释 的 内 容 ， 而 不 是 被 3 次 引用 的 文本 。 用 检查 “>>>” 后 的 代码 是 否 为 合法 Python 代码 的 方 
式 来 解决 这 个 问题 。 如 果 合 法 ， 那 就 显示 这 一 行 数据 ， 如 果 不 合法 ， 认 为 是 引用 文本 ， 不 显示 。 附 
加 题 : 你 的 解决 方案 再 解决 这 样 一 个 小 问题 : 我 们 没有 去 掉 前 导 的 空格 ， 因 为 它 可 能 是 

Python 代码 的 缩 进 。 如 果真 的 是 代码 的 缩 进 ， 就 显示 它 ， 否 则 ， 认 为 它 是 一 般 的 文本 ， 先 对 字 
符 串 用 1strip0 〇 方法 处 理 后 再 显示 。 





























17-14. ”查找 文章 。 写 一 个 NNTP 客户 端 程序 ， 让 用 户 能 选择 并 登录 感 兴趣 的 新 闻 组 。 在 登录 成 
功 后 ， 提 示 用 户 输入 一 些 关键 字 ， 使 用 这 些 关 键 字 来 查找 文章 的 标题 。 把 符合 要 求 的 文章 列 出 来 显 
示 给 用 户 。 用 户 可 以 在 列表 中 选择 某 一 篇 文章 进行 阅读 ， 这 时 要 能 显示 选 定 文章 的 内 容 。 程 序 还 要 
有 简单 的 导航 功能 ， 如 分 页 等 。 如 果 没 有 给 出 搜索 关键 字 ， 则 显示 所 有 的 文章 。 
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17-15. 搜索 内 容 。 修 改 上 一 题 你 的 脚本 , 让 脚本 同时 搜索 主题 和 文章 内 容 。 多 许 关键 字 的 “与 ” 
CAND) 和 “或 ”COR) 的 操作 。 也 要 允许 指定 在 标题 和 文章 内 容 的 “与 ”CAND) 和 “或 ”(OR) ED, 
关键 字 要 只 在 标题 里 出 现 ， 只 在 内 容 里 出 现 或 两 者 里 面 都 要 出 现 。 


























17-16. 线索 化 的 新 闻 阅 读 工 具 。 把 不 同 的 回帖 组 织 到 一 个 “文章 线索 ”中 。 也 就 是 说 ， 把 相 
关 的 文章 放 在 一 起 ， 与 文章 什么 时 候 发 的 没有 关系 。 同 一 个 线索 中 的 文章 按时 间 顺 序 排 列 。 

用 户 可 以 : 

(a) 选择 某 一 篇 文章 进行 阅读 ， 然 后 可 以 选择 回 到 文章 列表 ， 顺 序 了 阅读 当前 线索 的 

前 一 篇 文章 或 是 后 一 篇 文章 。 

(b) 允许 回复 线索 ， 可 以 选择 复制 并 引用 之 前 文章 ， 用 跟 贴 的 方式 回复 到 整个 新 闻 组 。 附 加 题 : 
也 允许 私下 用 e-mail 进行 回复 。 

(c) 永久 地 删除 线索 ， 即 后 续 的 相关 文章 不 会 在 文章 列表 中 显示 。 要 实现 这 个 功能 ， 你 应 该 把 
要 删除 的 文章 的 列表 和 暂时 记录 下 来 。 一 个 线索 在 几 个 月 之 后 还 没有 人 回复 的 话 ， 你 可 以 认为 这 个 线 
索 已 经 死 了 。 
































17-17. GUI 新 闻 阅 读 工具 。 跟 上 面 的 FTP 练习 差不多 ,选择 一 个 GUI 工具 包 来 实现 一 个 完整 的 ， 
独立 的 GUI 新 闻 阅 读 工 具 。 





17-18. 3E RJ . Be FIP 的 ftpmirror.py — fÉ > NNTP 也 有 一 个 示例 脚本 : 
Demo/scripts/newslist. py。 运 行 它 。 这 个 脚本 在 很 久之 前 就 写 好 了 ， 你 可 以 做 一 些 翻新 工作 。 做 








为 练习 ， 你 要 用 Python 新 版 本 的 一 些 特性 和 你 的 Python 开发 技巧 来 重 构 这 个 脚本 。 让 这 个 脚本 运 
行 得 更 快 。 你 可 以 使 用 列表 解析 和 生成 器 表达 式 ， 用 更 智能 的 字符 串 连 接 而 不 是 调用 不 必要 的 函数 


Age 
"do 

















17-19. 缓冲。 如 其 作者 所 说 ，newslist.py 的 另 一 个 问题 是 ,“ 我 应 该 把 要 忽略 的 空 的 新 闻 组 
的 列表 保存 下 来 ， 在 每 次 运行 的 时 候 检查 一 下 是 否 有 新 的 文章 ， 但 我 真 的 抽 不 出 时 间 ”。 你 来 实现 这 
个 功能 。 你 可 以 直接 修改 它 ， 也 可 以 修改 你 之 前 的 脚本 。 








E-MAIL 








17-20. 标识 符 。POP3 的 pass_() 方 法 用 于 在 调用 login 0) 方法 传 了 用 户 名 之 后 ， 传 递 密码 。 你 
能 不 能 说 出 ， 为 什么 这 个 方法 命名 时 要 在 后 面 加 一 个 下 划 线 ， 即 “pass_(0) ”， 而 不 是 “pass 0 ”? 





17-21. IMAP。 现 在 ， 你 已 经 熟悉 了 POP 是 怎么 工作 的 。 这 方面 的 经 验 对 你 写 一 个 IMAP 客户 端 
程序 也 是 有 帮助 的 。 研 究 一 下 IMAP 协议 的 RFC 文档 ， 使 用 Python 的 imaplib 模块 来 实现 一 个 IMAP 
客户 端 程序 。 


下 面 的 练习 题 跟 本 章 〈 例 17.3) 中 的 myMail. py 程序 有 关 。 











17-22. e-mail k. Æ myMail. py 的 最 后 几 行 ， 比 较 了 发 送 的 信息 体 与 接收 到 的 e-mail 的 信息 
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体 。 写 一 段 相似 的 代码 ， 比 较 信息 头 。 注 意 ， 要 忽略 新 加 入 的 头 。 
17-23. ”错误 检查 。 加 入 SMTP 和 POP3 的 错误 检查 。 


17-24. SMTP 和 IMAP。 在 简单 的 myMail. py 中 ， 加 入 IMAP 的 支持 。 附 加 题 : 支持 两 种 邮件 下 
载 协 议 ， 让 用 户 选 择 要 使 用 哪 一 种 协议 。 











17-25. ”撰写 e-mail。 再 次 扩展 你 之 前 的 程序 ， 人 允许 用 户 撰 写 和 发 送 e-mail. 














17-26. e-mail 应 用 程序 。 再 次 扩展 你 的 e-mail 应 用 程序 ,在 其 中 加 入 更 有 用 的 邮箱 管理 功能 。 
你 的 程序 要 能 读 出 当前 所 有 e-mail 的 信息 ， 并 显示 其 主题 。 用 户 可 以 选择 想 要 看 的 邮件 。 附 加 题 : 
要 能 文 持 用 外 部 程序 查看 附件 。 

















17-27. GUI. 给 你 的 脚本 加 入 GUI 的 功能 ， 让 它 成 为 一 个 实用 的 完整 的 e-mail 应 用 程序 。 


17-28. ”垃圾 邮件 的 特点 。 不 请 自 来 的 垃圾 邮件 (spam) 是 当今 的 一 大 问题 。 所 幸 ， 针 对 这 个 
问题 有 不 少 好 的 解决 方案 。 我 们 不 用 你 来 重新 发 明 轮 子 ， 我 们 想 让 你 了 解 一 些 垃圾 邮件 的 特点 。 

















(a) “mbox” 格 式 。 在 开始 之 前 ， 我 们 要 把 你 想 处 理 的 e-mail 信息 转 为 一 个 公共 的 格式 。 比 
如 “mbox” 格 式 。( 如 果 你 愿意 ， 你 也 可 以 使 用 别 的 格式 。 如果 你 已 经 有 了 一 些 mbox 格式 的 消息 ， E 
把 它们 合并 到 一 个 文件 中 。 
(b) 头 。 很 多 e-mail 的 头 上 就 看 出 有 垃圾 邮件 的 线索 。( 你 可 以 用 email 包 或 自己 解析 头 )。 
写 一 段 代 码 来 回答 以 下 问题 : 
- 发 送 这 个 消息 的 e-mail 客户 端 软件 是 什么 ? (检查 X-Mailer $) 
- 报 文 ID (Message-ID 头 ) 的 格式 是 否 合法 ? 
- From, Received 和 Return-Path 头 的 域名 是 否 不 匹配 ? 域名 和 IP 地 址 是 否 不 匹配 ? 有 没有 
X-Authentication-Warning 3k? 如 果 有 的 话 ， 内 容 是 什么 ? 
(c) 信息 服务 器 。 一 些 服务 器 如 WHOIS, SenderBase. org 等 可 以 根据 IP 地 址 或 域名 帮助 你 找 
到 e-mail 来 自 何方 。 找 到 一 些 这 样 的 服务 ， 写 一 些 代 码 来 得 到 来 源 地 的 国 别 ， 城 市 ， 网 络 所 有 者 的 
名 字 ， 联 系 方法 等 。 
(d 关键 字 。 垃 圾 邮件 中 ， 有 一 些 字 经 常 出 现 。 你 之 前 一 定 见 过 ， 它 们 是 单个 的 字母 ， 开 头 大 
写 的 随机 字母 等 。 把 你 常见 的 一 些 大 量 在 垃圾 邮件 中 出 现 的 词汇 放 在 一 个 列表 中 。 把 出 现 了 这 些 词 
汇 的 邮件 做 为 疑似 垃圾 邮件 隔离 。 附 加 题 : 设计 一 种 算法 或 加 入 一 些 关 键 字 的 变形 来 找 出 这 些 邮 件 。 
(e) 钓鱼 。 这 些 垃圾 邮件 总 是 想 把 他 们 伪装 成 来 自 大 银行 或 某 个 知名 的 网 站 的 合法 的 e-mail。 
里 面包 含 某 种 链接 ， 引 诱 用 户 输入 自己 私密 的 或 是 敏感 的 信息 ， 如 登录 用 户 名 ， 密 码 和 信用 卡 的 卡 
号 等 。 这 些 骗子 往往 做 得 足以 以 假 乱 真 。 不 过 ， 他 们 还 是 免不了 要 让 用 户 登 录 到 与 他 们 声称 的 并 不 
相符 的 网 站 。 这 里 ， 就 可 能 会 透露 出 很 多 信息 ， 如 ， 看 上 去 很 乱七八糟 的 域名 ， 只 用 了 IP 地 址 ， 或 
是 32 位 整数 形式 而 不 是 字 节 形式 的 IP 地 址 等 。 写 一 段 代 码 来 判断 一 封 看 上 去 像 正 式 交 流 的 e-mail 
是 真 的 还 是 假 的 。 
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可 以 在 

http://www. networksorcery. com/enp/topic/ipsuite. htm#Application%20layer%20protocol 
S 

找到 包含 本 章 中 所 列 的 那些 协议 在 内 的 各 种 因特网 协议 的 列表 。Python( 当 前》 所 支持 的 因 特 
网 协议 列表 可 以 在 http://docs. python. org/lib/internet. html 找到 。 








17-29. 开发 其 它 因 特 网 客户 端 程序 。 现 在 ， 你 已 经 看 到 了 4 个 Python 开发 因特网 客户 端 程序 
的 例子 。 选 一 种 Python 标准 库 中 支持 的 其 它 协议 ， 开 发 一 个 对 应 的 客户 端 程序 。 








17-30. * 开 发 一 种 新 的 因特网 客户 端 程序 。 这 个 难度 比较 大 : 找到 一 个 不 常用 的 ， 或 是 还 未 成 
型 的 Python 尚未 支持 的 协议 ， 实 现 它 。 如 果 做 得 好 的 话 ， 你 可 以 考虑 提交 一 个 PEP， 把 你 的 实现 加 
入 到 以 后 版 本 Python 的 标准 库 中 发 布 。 
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Chapter 1 S 


本 节 中 ， 我 们 将 探索 在 Python 中 ， 用 多 线程 编程 技术 实现 代码 并 行 性 的 几 种 不 同 的 方法 。 在 前 
面 几 节 中 ， 我 们 将 介绍 进程 与 线程 的 区 别 。 然 后 介绍 多 线程 编程 的 概念 。( 已 经 熟悉 多 线程 编程 的 读 
者 可 以 直接 跳 到 第 18.3. 5 节 )。 本 章 的 最 后 几 贡 将 演示 在 Python 中 如 何 使 用 threading 和 Queue 模 
块 来 实现 多 线程 编程 。 


$ 18.1 引言 /动机 E 


在 多 线程 〈MT) 编程 出 现 之 前 ， 电 脑 程 序 的 运行 由 一 个 执行 序列 组 成 ， 执 行 序列 按 顺序 在 主机 
的 中 央 处 理 器 〈CPU) 中 和 运行。 无 论 是 任务 本 身 要 求 顺 序 执行 还 是 整个 程序 是 由 多 个 子 任务 组 成 ， 程 
序 都 是 按 这 种 方式 执行 的 。 即 使 子 任务 相互 独立 ， 互 相 无 关 〈 即 ， 一 个 子 任务 的 结果 不 影响 其 它 子 
任务 的 结果 ) 时 也 是 这 样 。 这 样 是 不 是 有 点 不 合 逻 辑 ? 会 不 会 想 要 并 行 运行 这 些 相 互 独立 的 子 任 务 
WE? 这 样 的 并 行 处 理 可 以 大 幅度 地 提升 整个 任务 的 效率 。 这 就 是 多 线程 编程 的 目的 。 



































































































































多 线程 编程 对 于 某 些 任务 来 说 ,是 最 理想 的 。 这 些 任务 具有 以 下 特点 : 它们 本 质 上 就 是 异步 的 ， 
需要 有 多 个 并 发 事务 ， 各 个 事务 的 运行 顺序 可 以 是 不 确定 的 ， 随 机 的 ， 不 可 预测 的 。 这 样 的 编程 任 
务 可 以 被 分 成 多 个 执行 流 ， 每 个 流 都 有 一 个 要 完成 的 目标 。 根 据 应 用 的 不 同 ， 这 些 子 任务 可 能 都 要 
计算 出 一 个 中 间 结 果 ， 用 于 合并 得 到 最 后 的 结果 。 




































































运算 密集 型 的 任务 一 般 都 比较 容易 分 隔 成 多 个 子 任务 ， 可 以 顺序 执行 或 以 多 线程 的 方式 执行 。 
单线 程 处 理 多 个 外 部 输入 源 的 的 任务 就 不 是 那么 容易 了 。 这 种 编程 任务 如 果 不 用 多 线程 的 方式 处 理 ， 
则 一 定 要 使 用 一 个 或 多 个 计时 器 来 实现 。 












































一 个 顺序 执行 的 程序 要 从 每 个 1/0( 输 入 /输出 ) 终端 信 道 检查 用 户 的 输入 时 ， 程 序 无 论 如 何 也 不 
能 在 读 取 1/0 终端 信道 的 时 候 阻 塞 。 因 为 用 户 输入 的 到 达 是 不 确定 的 ， 阻 塞 会 导致 其 它 1/0 信息 的 
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数据 不 能 被 处 理 。 顺 序 执行 的 程序 必须 使 用 非 阻塞 I/0， 或 是 带 有 计时 器 的 阻塞 I/0 (这 样 才 能 保证 
阻塞 只 是 暂时 的 )。 



































由 于 顺序 执行 的 程序 只 有 一 个 线程 在 运行 。 它 要 保证 它 要 做 的 多 任务 ， 不 会 有 某 个 任务 占用 太 
多 的 时 间 ， 而 且 要 合理 地 分 配 用 户 的 响应 时 间 。 执 行 多 任务 的 顺序 执行 的 程序 一 般 程序 控制 流程 都 
很 复杂 ， 难 以 理解 。 






































使 用 多 线程 编程 和 一 个 共享 的 数据 结构 如 Queue. (本 章 后 面 会 介绍 的 一 种 多 线程 队列 数据 结构 )， 
这 种 程序 任务 可 以 用 几 个 功能 单一 的 线程 来 组 织 : 








€ UserRequestThread: 负责 读 取 客 户 的 输入 , 可 能 是 一 个 1/0 信道 。 程 序 可 能 创建 多 个 线程 ， 
每 个 客户 一 个 ， 请 求 会 被 放 入 队列 中 。 

€ RequestProcessor: 一 个 负责 从 队列 中 获取 并 处 理 请 求 的 线程 , 它 为 下 面 那 种 线程 提供 输出 。 

€ ReplyThread: 负责 把 给 用 户 的 输出 取出 来 ， 如 果 是 网 络 应 用 程序 就 把 结果 发 送出 去 ， 否 则 
就 保存 到 本 地 文件 系统 或 数据 库 中 。 























把 这 种 编程 任务 用 多 线程 来 组 织 可 以 降低 程序 的 复杂 度 ， 并 使 得 干净 ， 有 效 和 具有 民 好 组 织 地 
程序 结构 实现 变 得 可 能 。 每 个 线程 的 逻辑 都 不 会 很 复杂 ， 因 为 它 要 做 的 事情 很 清楚 。 例 如 ， 
UserRequestThread 只 是 从 用 户 或 某 个 数据 源 读 取 数 据 ， 放 到 一 个 队列 中 ， 等 待 其 它 线 程 进一步 的 
处 理 ， 等 等 ， 每 个 线程 都 有 自己 明确 的 任务 。 你 只 要 设计 好 每 个 线程 要 做 什么 ， 并 把 要 做 的 事 做 好 è 
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18.2 线程 和 进程 
18. 2. 1 什么 是 进程 ? 








计算 机 程序 只 不 过 是 磁盘 中 可 执行 的 ， 二 进 制 〈 或 其 它 类 型 ) 的 数据 。 它 们 只 有 在 被 读 取 到 内 
存 中 ， 被 操作 系统 调用 的 时 候 才 开始 它们 的 生命 期 。 进 程 《 有 时 被 称 为 重量 级 进程 ) 是 程序 的 一 次 
执行 。 每 个 进程 都 有 自己 的 地 址 空间 ， 内 存 ， 数 据 栈 以 及 其 它 记 录 其 运行 轨迹 的 辅助 数据 。 操 作 系 
统管 理 在 其 上 运行 的 所 有 进程 ， 并 为 这 些 进 程 公平 地 分 配 时 间 。 进 程 也 可 以 通过 fork 和 spawn 操作 
来 完成 其 它 的 任务 。 不 过 各 个 进程 有 自己 的 内 存 空 间 ， 数 据 栈 等 ,所 以 只 能 使 用 进程 间 通 讯 (IPC)， 
而 不 能 直接 共享 信息 。 






































18. 2.2 什么 是 线程 ? 





线程 (有 时 被 称 为 轻 量 级 进程 ) 跟 进程 有 些 相 似 , 不 同 的 是 ， 所 有 的 线程 运行 在 同一 个 进程 中 ， 
k 享 相同 的 运行 环境 。 它 们 可 以 想像 成 是 在 主 进程 或 “主线 程 ” 中 并 行 运行 的 “迷你 进程 ” 
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线程 有 开始 ， 顺 序 执行 和 结束 三 部 分 。 它 有 一 个 自己 的 指令 指针 ， 记 录 自 己 运行 到 什么 地 方 。 
线程 的 运行 可 能 被 抢占 《中 断 )， 或 暂时 的 被 挂 起 〈 也 叫 睡眠 )， 让 其 它 的 线程 运行 ， 这 叫做 让 步 。 
一 个 进程 中 的 各 个 线程 之 间 共 享 同一 片 数 据 空间 ， 所 以 线程 之 间 可 以 比 进程 之 间 更 方便 地 共享 数据 
以 及 相互 通讯 。 线 程 一 般 都 是 并 发 执行 的 ， 正 是 由 于 这 种 并 行 和 数据 共享 的 机 制 使 得 多 个 任务 的 合 
作 变 为 可 能 。 实 际 上 ， 在 单 CPU 的 系统 中 ， 真 正 的 并 发 是 不 可 能 的 ， 每 个 线程 会 被 安排 成 每 次 只 运 
行 一 小 会 ， 然 后 就 把 CPU 让 出 来 ， 让 其 它 的 线程 去 运行 。 在 进程 的 整个 运行 过 程 中 ， 每 个 线程 都 只 
做 自己 的 事 ， 在 需要 的 时 候 跟 其 它 的 线程 共享 运行 的 结果 。 












































当然 ， 这 样 的 共享 并 不 是 完全 没有 人 危险 的 。 如 果 多 个 线程 共同 访问 同一 片 数 据 ， 则 由 于 数据 访 
问 的 顺序 不 一 样 ， 有 可 能 导致 数据 结果 的 不 一 致 的 问题 。 这 叫做 竞 态 条 件 (race condition). 3&X5 
的 是 ， 大 多 数 线程 库 都 带 有 一 系列 的 同步 原 语 ， 来 控制 线程 的 执行 和 数据 的 访问 。 























另 一 个 要 注意 的 地 方 是 ， 由 于 有 的 函数 会 在 完成 之 前 阻塞 住 ， 在 没有 特别 为 多 线程 做 修改 的 情 
况 下 ， 这 种 “ 贪 焚 ” 的 函数 会 让 CPU 的 时 间 分 配 有 所 倾斜 。 导 致 各 个 线程 分 配 到 的 运行 时 间 可 能 不 
尽 相 同 ， 不 尽 公平 。 














18. 3 Python、 线 程 和 全 局 解释 器 锁 


18.3.1 全 局 解释 器 锁 (GIL) 
Python 代码 的 执行 由 Python 虚拟 机 (也 叫 解释 器 主 循环 ) 来 控制 。Python 在 设计 之 初 就 考虑 到 K 


要 在 主 循环 中 ， 同 时 只 有 一 个 线程 在 执行 ， 就 像 单 CPU 的 系统 中 运行 多 个 进程 那样 ， 内 存 中 可 以 存 
放 多 个 程序 , 但 任意 时 刻 , 只 有 一 个 程序 在 CPU 中 运行 。 同 样 地 ， 虽 然 Python 解释 器 中 可 以 “运行 ” 
多 个 线程 ， 但 在 任意 时 刻 ， 只 有 一 个 线程 在 解释 器 中 运行 。 





























对 Python 虚拟 机 的 访问 由 全 局 解释 器 锁 〈GIL) 来 控制 ， 正 是 这 个 锁 能 保证 同一 时 刻 只 有 一 个 
线程 在 运行 。 在 多 线程 环境 中 ，Python 虚拟 机 按 以 下 方式 执行 : 




















. ”设置 GIL 
2. ”切换 到 一 个 线程 去 运行 
3. ”运行 : 


a.， 指 定数 量 的 字 节 码 指 令 ， 或 者 

b. 线程 主动 让 出 控制 (可 以 调用 time. sleep (00) 
4. ”把 线程 设置 为 睡眠 状态 
5. ”解锁 GIL 
6. ”再 次 重复 以 上 所 有 步骤 














在 调用 外 部 代码 (如 C/C++ 扩展 函数 〉 的 时 候 ，GIL 将 会 被 锁定 ， 直 到 这 个 函数 结束 为 上 上 〈 由 于 
在 这 期 间 没 有 Python 的 字 节 码 被 运行 ,所 以 不 会 做 线程 切换 )。. 编 写 扩展 的 程序 员 可 以 主动 解锁 GIL。 
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Ab, Python 的 开发 人 员 则 不 用 担心 在 这 些 情况 下 你 的 Python 代码 会 被 锁 住 。 











例如 ， 对 所 有 面向 1/0 的 (会 调用 内 建 的 操作 系统 C 代码 的 ) 程序 来 说 ，GIL 会 在 这 个 1/0 调用 之 
前 被 释放 ,以 允许 其 它 的 线程 在 这 个 线程 等 待 1/0 的 时 候 运 行 。 如 果菜 线程 并 未 使 用 很 多 1/0 操作 ， 
它 会 在 自己 的 时 间 片 内 一 直 占 用 处 理 器 (和 GIL)。 也 就 是 说 ，1I/0 密集 型 的 Python 程序 比 计算 密集 
型 的 程序 更 能 充分 利用 多 线程 环境 的 好 处 。 














对 源 代 码 ， 解 释 器 主 循环 和 GIL 感 兴趣 的 人 ， 可 以 看 看 Python/ceval. c 文件 。 


18. 3. 2 退出 线程 





当 一 个 线程 结束 计算 ， 它 就 退出 了 。 线 程 可 以 调用 thread. exit 0 之 类 的 退出 函数 ， 也 可 以 使 用 
Python 退出 进程 的 标准 方法 ， 如 sys. exit O 或 抛 出 一 个 SystemExit 异常 等 。 不 过 ， 你 不 可 以 直接 
“Ape” (“kill”) 一 个 线程 。 

















在 下 面 一 节 中 ， 我 们 将 要 讨论 两 个 跟 线 程 有 关 的 模块 。 这 两 个 模块 中 ， 我 们 不 建议 使 用 thread 
模块 。 这 样 做 有 很 多 原因 ， 很 明显 的 一 个 原因 是 ， 当 主线 程 退 出 的 时 候 ， 所 有 其 它 线程 没有 被 清除 
就 退出 了 。 但 男 一 个 模块 threading 就 能 确保 所 有 “重要 的 ” 子 线程 都 退出 后 ， 进 程 才 会 结束 。( 我 
们 等 一 会 会 详细 说 明 什 么 叫 “ 重 要 的 ”， 请 参阅 守护 线程 的 核心 提示 )。 









































主线 程 应 该 是 一 个 好 的 管理 者 ， 它 要 了 解 每 个 线程 都 要 做 些 什么 事 ， 线 程 都 需要 什么 数据 和 什 
么 参数 ， 以 及 在 线程 结束 的 时 候 ， 它 们 都 提供 了 什么 结果 。 这 样 ， 主 线程 就 可 以 把 各 个 线程 的 结果 
组 合成 一 个 有 意义 的 最 后 结果 。 





























18. 3. 3 Æ Python 中 使 用 线程 


YE Win32 flLinux, Solaris, MacOS, *BSD 等 大 多 数 类 Unix 系统 上 运行 时 ，Python 支持 多 线程 
编程 。Python 使 用 POSIX 兼容 的 线程 ， 即 pthreads. 








默认 情况 下 ， 从 源 代码 编译 的 (2. 0 及 以 上 版 本 的 )Python 以 及 Win32 的 安装 包 里 ， 线 程 支持 是 
打开 的 。 想 要 从 解释 器 里 判断 线程 是 否 可 用 ， 只 要 简单 的 在 交互 式 解 释 器 里 尝试 导入 thread 模块 就 
行 了 ， 只 要 没 出 现 错误 就 表示 线程 可 用 。 























222 import thread 
Po 


如 果 你 的 Python 解释 器 在 编译 时 ， 没 有 打开 线程 支持 ， 导 入 模块 会 失败 : 
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222 import thread 
Traceback (innermost last): File ^X«stdim^^, line 1, in ? 


ImportError: No module named thread 











这 种 情况 下 ,你 就 要 重新 编译 你 的 Python 解释 器 才能 使 用 线程 .你 可 以 在 运行 配置 脚本 的 时 候 ， 
加 上 “--with-thread” 参 数 。 参 考 你 的 发 布 版 的 README 文件 ， 以 获取 如 何 编译 支持 线程 的 Python 
的 相关 信息 。 





18. 3. 4 没有 线程 支持 的 情况 


第 一 个 例子 中 ， 我 们 会 使 用 time. sleep 0 函数 来 演示 线程 是 怎样 工作 的 。time. sleep () 需要 一 
个 浮 点 型 的 参数 , 来 指定 “睡眠 ”的 时 间 (单位 秒 )。 这 就 意味 着 , 程序 的 运行 会 被 挂 起 指定 的 时 间 。 




















我 们 要 创建 两 个 “计时 循环 ” 一 个 睡眠 4 秒 种 ， 一 个 睡眠 2 秒 种 ,分 别 是 loop00 和 loopl 0. 
《我 们 命名 为 “1loop0” 和 “1loop1” 表 示 我 们 将 有 一 个 循环 的 序列 )。 如 果 我 们 像 例 18. 1 的 onethr. py 
中 那样 ， 在 一 个 进程 或 一 个 线程 中 ， 顺 序 地 执行 loop0 0 和 loop10 ， 那 运行 的 总 时 间 为 6 秒 。 在 启 
动 1oop00 ，loop10 ， 和 其 它 的 代码 时 ， 也 要 花 去 一 些 时 间 ， 所 以 ， 我 们 看 到 的 总 时 间 也 有 可 能 会 
是 7 秒 钟 。 














例 18.1 单线 程 中 运行 的 循环 (onethr. py) 








在 单线 程 中 顺序 执行 两 个 循环 。 一 定 要 一 个 循环 结束 后 ， 男 一 个 才能 开始 。 总 时 间 是 各 个 循环 
运行 时 间 之 和 。 





1#!/usr/bin/env python 

2 

3from time import sleep, ctime 

4 

5def loopt 0: 

6print 'start loop 0 at:', ctime( 
/sleep (4) 

Sprint 'loop 0 done at:', ctime() 

9 

10 def looplQ: 

Jl print "start loop J at:’”, etimeQ 
12  sleep(2) 

13 print 'loop 1 done at:’, ctime() 
14 

15 def main: 
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16 print 'starting at:', ctime() 
17  loop0) 

18 | looplQ 

19 print 'all DONE at:’, ctimeQ 
20 

21 if name ==? main 

22 main 








我 们 可 以 通过 运行 onethr. py 来 验证 这 一 点 ， 下 面 是 运行 的 输出 : 





$ onethr. py 

starting at: Sun Aug 13 05:03:34 2006 
start loop 0 at: Sun Aug 13 05:03:34 2006 
loop 0 done at: Sun Aug 13 05:03:38 2006 
start loop 1 at: Sun Aug 13 05:03:38 2006 
loop I done at: Sun Aug 13 05:03:40 2006 
all DONE at: Sun Aug 13 05:03:40 2006 











假定 loop0Q 和 loop] (里 做 的 不 是 睡眠 ， 而 是 各 自 独立 的 ， 不 相关 的 运算 ， 各 自 的 运算 结果 
到 最 后 将 会 汇总 成 一 个 最 终 的 结果 。 这 时 ， 如 果 能 让 这 些 计算 并 行 执行 的 话 ， 那 不 是 可 以 减少 总 的 
运行 时 间 吗 ?这 就 是 我 们 现在 要 介绍 的 多 线程 编程 的 前 提 条 件 。 














18. 3.5 Python 的 threading 模块 








Python 提供 了 几 个 用 于 多 线程 编程 的 模块 ， 包 括 thread, threading 和 Queue 等 。thread 和 
threading 模 块 允 许 程序 员 创 建 和 管理 线程 ,thread 模块 提供 了 基本 的 线程 和 锁 的 支持 ,而 threading 
提供 了 更 高 级 别 ， 功 能 更 强 的 线程 管理 的 功能 。Queue 模块 允许 用 户 创建 一 个 可 以 用 于 多 个 线程 之 间 
共享 数据 的 队列 数据 结构 。 我 们 将 分 别 介绍 这 几 个 模块 ， 并 给 出 一 些 例子 和 中 等 大 小 的 应 用 。 













































































核心 提示 : 避免 使 用 thread 模块 

出 于 以 下 几 点 考虑 ， 我 们 不 建议 您 使 用 thread 模块 。 首 先 ， 更 高 级 别 的 threading 模块 更 为 先 
H, 对 线程 的 支持 更 为 完善 , 而 且 使 用 thread 模块 里 的 属性 有 可 能 会 与 threading 出 现 冲 突 。 其 次 ， 
低级 别 的 thread 模块 的 同步 原 语 很 少 〈 实 际 上 只 有 一 个 )， 而 threading 模块 则 有 很 多 。 

不 过 ， 出 于 对 学 习 Python 和 线程 的 兴趣 ， 我 们 将 给 出 一 点 使 用 thread 模块 的 例子 。 这 些 代码 
只 用 于 学 习 目 的 ， 让 你 对 为 什么 应 该 避免 使 用 thread 模块 有 更 深 的 认识 ， 以 及 让 你 了 解 在 把 代码 改 
为 使 用 threading 和 Queue 模块 时 ， 我 们 能 获得 多 大 的 便利 。 

另 一 个 不 要 使 用 thread 原因 是 ， 对 于 你 的 进程 什么 时 候 应 该 结束 完全 没有 控制 ， 当 主线 程 结束 
时 ， 所 有 的 线程 都 会 被 强制 结束 掉 ， 没 有 警告 也 不 会 有 正常 的 清除 工作 。 我 们 之 前 说 过 ， 至 少 
threading 模块 能 确保 重要 的 子 线程 退出 后 进程 才 退 出 。 
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只 建议 那些 有 经 验 的 专家 在 想 访问 线程 的 底层 结构 的 时 候 ， 才 使 用 thread 模块 。 而 使 用 线程 的 
们 则 应 该 看 看 我 们 是 如 何 把 线程 应 用 到 我 们 的 第 一 个 程序 ， 从 而 增加 代码 的 可 读 性 ， 以 及 第 一 
子 如何 进 化 到 我 们 本 章 的 主要 的 代码 的 。 如 果 可 以 的 话 ， 你 的 第 一 个 多 线程 程序 应 该 尽 可 能 
threading 等 高 级 别 的 线程 模块 。 


18. 4 thread 模块 




















我 们 先 看 看 thread 模块 都 提供 了 些 什么 。 除 了 产生 线程 外 ，thread 模块 也 提供 了 基本 的 同步 数 
构 锁 对 象 (lock object， 也 叫 原 语 锁 ， 简 单 锁 ， 互 斥 锁 ， 互 斥 量 ， 二 值 信号 量 ) 。 如 之 前 所 说 ， 
原 语 与 线程 的 管理 是 密 不 可 分 的 。 
































K 18. 1 中 所 列 的 是 常用 的 线程 函数 以 及 LockType 类 型 的 锁 对 象 的 方法 。 











start new thread () 函数 是 thread 模块 的 一 个 关键 函数 ， 它 的 语法 与 内 建 的 apply O 函数 完全 
其 参数 为 : 函数 ， 函 数 的 参数 以 及 可 选 的 关键 字 参 数 。 不 同 的 是 ， 函 数 不 是 在 主线 程 里 运行 ， 
产生 一 个 新 的 线程 来 运行 这 个 函数 。 











现在 ， 把 线程 加 入 到 我 们 的 onethr. py 例子 中 。 稍 微 改 变 一 下 Loop* 0 函数 的 调用 方法 ， 我 们 


得 到 了 例 18. 2 的 mtsleepl. py. 


K 18.1 thread 模块 和 锁 对 象 





函数 描述 

thread 模块 函数 

start new thread (function, 

args, kwargs-None) 产生 一 个 新 的 线程 ， 在 新 线程 中 用 指定 的 参数 和 可 选 的 
kwargs 来 调用 这 个 函数 。 

allocate lock O 分 配 一 个 LockType 类 型 的 锁 对 象 

exit () 让 线程 退出 

LockType 类 型 锁 对 象 方法 

acquire (wait=None) 尝试 获取 锁 对 象 

locked () 如 果 获 取 了 锁 对 象 返回 True， 和 否则 返回 False 

release () 释放 锁 


例 18.2 使 用 thread 模块 (mtsleepl. py) 














这 儿 执 行 的 是 和 onethr. py 中 一 样 的 循环 ， 不 同 的 是 ， 这 一 次 我 们 使 用 的 是 thread 模块 提供 的 





简单 的 多 线程 的 机 制 。 两 个 循环 并 发 地 被 执行 《显然 ， 短 的 那个 先 结束 )。 总 的 运行 时 间 为 最 慢 的 那 
个 线程 的 运行 时 间 ， 而 不 是 所 有 的 线程 的 运行 时 间 之 和 。 
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1 #!/usr/bin/env python 
2 
3 import thread 





4 from time import sleep, ctime 

5 

6 def loop0: 

7 print 'start loop 0 at:', ctime(Q 

8 sleep (4) 

9 print ` loop 0 done at:', ctime() 

10 

77 def loopl 0: 

I2 print 'start loop 1 at:', ctimeQ 
13 sleep (2) 

14 print 'loop 1 done at:’, ctime( 
15 

16 def main(): 

17 print ‘starting at:', ctimeQ) 

18 thread. start_new_thread(loop0, ()) 
19 thread. start new thread(loopl, ()) 
20 sleep (6) 

21 print 'all DONE at:’, ctime Q 





22 
23 if name  -- ' main 
24 main Q 




















start new thread) 要 求 一 定 要 有 前 两 个 参数 。 所 以 ， 就 算 我 们 想 要 运行 的 函数 不 要 参数 ， 我 
们 也 要 传 一 个 空 的 元 组 。 











这 个 程序 的 输出 与 之 前 的 输出 大 不 相同 ， 之 前 是 运行 了 6. "7 秒 ， 而 现在 则 是 4 秒 ， 是 最 长 的 循 
环 的 运行 时 间 与 其 它 的 代码 的 时 间 总 和 。 


$ mtsleepl. py 

starting at: Sun Aug 13 05:04:50 2006 
start loop 0 at: Sun Aug 13 05:04:50 2006 
start loop 1 at: Sun Aug 13 05:04:50 2006 
loop I done at: Sun Aug 13 05:04:52 2006 
loop 0 done at: Sun Aug 13 05:04:54 2006 
all DONE at: Sun Aug 13 05:04:56 2006 
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睡眠 4 秒 和 2 秒 的 代码 现在 是 并 发 执行 的 。 这样， 就 使 得 总 的 运行 时 间 被 缩短 了 。 你 可 以 看 到 ， 
loop] 甚至 在 loopO 前 面 就 结束 了 。 程序 的 一 大 不 同 之 处 就 是 多 了 一 个 “sleep(6) ”的 函数 调用 。 为 
什么 要 加 上 这 一 句 呢 ? 因为 ， 如 果 我 们 没有 让 主线 程 停 下 来 ， 那 主线 程 就 会 运行 下 一 条 语句 ， 显 示 
“all done”， 然 后 就 关闭 运行 着 loop0 O 和 loop] O 的 两 个 线程 ， 退 出 了 。 
































我 们 没有 写 让 主线 程 停 下 来 等 所 有 子 线程 结束 之 后 再 继续 运行 的 代码 。 这 就 是 我 们 之 前 说 线程 
需要 同步 的 原因 。 在 这 里 ， 我 们 使 用 了 sleep O 函数 做 为 我 们 的 同步 机 制 。 我 们 使 用 6 秒 是 因为 我 们 
已 经 知道 ， 两 个 线程 〈 你 知道 ， 一 个 要 4 秒 ， 一 个 要 2 秒 ) 在 主线 程 等 待 6 秒 后 应 该 已 经 结束 了 。 





























你 也 许 在 想 ， 应 该 有 什么 好 的 管理 线程 的 方法 ， 而 不 是 在 主线 程 里 做 一 个 额外 的 延 时 6 EDR 
作 。 因 为 这 样 一 来 ， 我 们 的 总 的 运行 时 间 并 不 比 单线 程 的 版 本 来 得 少 。 而 且 ， 像 这 样 使 用 sleep () 
函数 做 线程 的 同步 操作 是 不 可 靠 的 。 如 果 我 们 的 循环 的 执行 时 间 不 能 事先 确定 的 话 ， 那 怎么 办 呢 ? 
这 可 能 造成 主线 程 过 早 或 过 晚 退 出 。 这 就 是 锁 的 用 武之 地 了 。 




















上 一 次 修改 程序 ,我 们 去 掉 了 loop 函数 ,现在 ,我 们 要 再 一 次 修改 程序 为 例 18. 3 的 mtsleep2. py, 
引入 锁 的 概念 。 运 行 它 ， 我 们 看 到 ， 其 输出 与 mtsleepl.py 很 相似 ， 唯 一 的 区 别 是 我 们 不 用 为 线程 
什么 时 候 结 束 再 做 额外 的 等 待 。 使 用 了 锁 ， 我 们 就 可 以 在 两 个 线程 都 退出 后 ， 马 上 退出 。 





$ mtsleep2. py 


s starting at: Sun Aug 13 16:34:41 2006 E 
start loop 0 at: Sun Aug 13 16:34:41 2006 
start loop 1 at: Sun Aug 13 16:34:41 2006 
loop I done at: Sun Aug 13 16:34:43 2006 
loop 0 done at: Sun Aug 13 16:34:45 2006 
all DONE at: Sun Aug 13 16:34:45 2006 
我 们 是 怎么 通过 锁 来 完成 任务 的 呢 ? 先 看 一 看 代码 吧 。 


例 18. 3 使 用 线程 和 锁 (mtsleep2. py) 


这 里 ， 使 用 锁 比 mtsleepl.py 那里 在 主线 程 中 使 用 sleep () 函数 更 合理 。 





7 #!/usr/bin/env python 

2 

3 import thread 

4 from time Import sleep, ctime 
5 

6 loops = [4,2] 

7 

8 def loop(nloop, nsec, lock): 





$— 一 * 一 
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9 print 'start loop’, nloop, 'at:', ctime( 





10 sleep (nsec) 

li print 'loop', nloop, 'done at:', ctime() 
12 lock. release () 

13 

14 def main: 

15 print 'starting at:', ctime( 


16 locks = [] 
17 nloops = range (len (loops)) 
18 


19 for i in nloops: 
20 lock = thread. allocate_lock () 
21 lock. acquire () 
22 locks. append (lock) 
23 
24 for i in nloops: 
25 thread. start new thread (loop, 
26 (i, loopsíi], locks[i])) 

27 

28 for i in nloops: 

29 while locks[i]. locked () : pass 
30 

31 print 'all DONE at:’, ctimeQ 
32 

33 if name ==’ main 


34 main 0 





逐 行 解释 


1-6 行 

在 Unix 启动 信息 行 后 面 ， 我 们 导入 了 thread 模块 和 time 模块 里 我 们 早已 熟悉 的 几 个 函数 。 我 
们 不 再 在 函数 里 写 死 要 等 4 秒 和 2 秒 ， 而 是 使 用 一 个 loopO 函数 ， 把 这 些 常量 放 在 一 个 列表 loops 
里 。 











8-12 行 

loop O 函数 替换 了 我 们 之 前 的 那 几 个 loop* O 函数。 在 loop O 函数 里 ， 增 加 了 一 些 锁 的 操作 。 
一 个 很 明显 的 改变 是 ， 我 们 现在 要 在 函数 中 记录 下 循环 的 号 码 和 要 睡眠 的 时 间 。 最 后 一 个 不 一 样 的 
地 方 就 是 那个 锁 了 。 每 个 线程 都 会 被 分 配 一 个 事先 已 经 获得 的 锁 ， 在 sleep O 的 时 间 到 了 之 后 就 释放 
相应 的 锁 以 通知 主线 程 ， 这 个 线程 已 经 结束 了 。 
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14-34 1T 

主要 的 工作 在 包含 三 个 循环 的 main O 函数 中 完成 。 我 们 先 调用 thread. allocate lock () 函数 创 
建 一 个 锁 的 列表 ， 并 分 别 调用 各 个 锁 的 acquire O 函数 获得 锁 。 获 得 锁 表 示 “ 把 锁 锁 上 ”。 锁 上 后 ， 
我 们 就 把 锁 放 到 锁 列表 locks 中 。 下 一 个 循环 创建 线程 ， 每 个 线程 都 用 各 自 的 循环 号 ， 睡 眠 时 间 和 
锁 为 参数 去 调用 loop) 函数 。 为 什么 我 们 不 在 创建 锁 的 循环 里 创建 线程 呢 ? 有 以 下 几 个 原因 : (1) 我 
们 想到 实现 线程 的 同步 ， 所 以 要 让 “所 有 的 马 同 时 冲 出 栅栏 >。 (2) 获取 锁 要 花 一 些 时 间 ， 如 果 你 的 
线程 退出 得 “ 太 快 ” 可 能 会 导致 还 没有 获得 锁 ， 线 程 就 已 经 结束 了 的 情况 。 





















































在 线程 结束 的 时 候 ， 线 程 要 自己 去 做 解锁 操作 。 最 后 一 个 循环 只 是 坐 在 那 一 直 等 〈 达 到 暂停 主 
线程 的 目的 )， 直 到 两 个 锁 都 被 解锁 为 止 才 继续 运行 。 由 于 我 们 顺序 检查 每 一 个 锁 ， 所 以 我 们 可 能 会 
要 长 时 间 地 等 待 运行 时 间 长 且 放 在 前 面 的 线程 ， 当 这 些 线程 的 锁 释 放 之 后 ， 后 面 的 锁 可 能 早 就 释放 
了 【表示 对 应 的 线程 已 经 运行 完了 )。 结 果 主 线程 只 能 窗 不 停 葡 地 完成 对 后 面 这 些 锁 的 检查 。 最 后 两 
行 代码 的 意思 你 应 该 已 经 知道 了 ， 就 是 只 有 在 我 们 直接 运行 这 个 脚本 时 ， 才 运行 main 0 函数 














在 核心 笔记 中 我 们 就 已 经 说 过 ， 使 用 thread 模块 只 是 为 了 给 读者 演示 如 何 进 行 多 线程 编程 。 你 
的 多 线程 程序 应 该 使 用 更 高 级 别 的 模块 ， 如 threading 等 。 现 在 我 们 就 开始 讨论 它 。 


18.5 threading 模块 














接 下 来 ， 我 们 要 介绍 的 是 更 高 级 别 的 threading 模块 ， 它 不 仅 提供 了 Thread 类 ， 还 提供 了 各 
种 非常 好 用 的 同步 机 制 。 表 18.2 列 出 了 threading 模块 里 所 有 的 对 象 。 














在 这 一 节 中 ， 我 们 会 演示 如 何 使 用 Thread 类 来 实现 多 线程 。 之 前 已 经 介绍 过 锁 
AN 


过 锁 的 基本 概念 ， 这 
里 我 们 将 不 会 提 到 锁 原 语 。 而 Thread 类 也 有 某 种 同步 机 制 ， 所 以 ， 没 有 必要 详细 介绍 锁 原 语 。 


表 18.2 threading 模块 对 象 



































threading 模块 对 象 描述 

Thread 表示 一 个 线程 的 执行 的 对 象 

Lock 锁 原 语 对 象 ( 跟 thread 模块 里 的 锁 对 象 相 同 ) 

RLock 可 重 入 锁 对 象 。 使 单线 程 可 以 再 次 获得 已 经 获得 了 的 锁 〈 递 归 锁 定 )。 

Condition 条 件 变 量 对 象 能 让 一 个 线程 停 下 来 , 等 待 其 它 线程 满足 了 某 个 “条 件 ”。 
如 ， 状 态 的 改变 或 值 的 改变 。 

Event 通用 的 条 件 变 量 。 多 个 线程 可 以 等 待 某 个 事件 的 发 生 ， 在 事件 发 生 后 ， 

所 有 的 线程 都 会 被 激活 。 

Semaphore 为 等 待 锁 的 线程 提供 一 个 类 似 “ 等 候 室 ” 的 结构 

BoundedSemaphore 与 Semaphore 类 似 ， 只 是 它 不 允许 超过 初始 值 

Timer LE Thread 相似 ， 只 是 ， 它 要 等 待 一 段 时 间 后 才 开 始 运行 。 
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核心 提示 : 守护 线程 

另 一 个 避免 使 用 thread 模块 的 原因 是 ， 它 不 支持 守护 线程 。 当 主线 程 退出 时 ， 所 有 的 子 线程 不 
论 它 们 是 否 还 在 工作 ， 都 会 被 强行 退出 。 有 时 ， 我 们 并 不 期 望 这 种 行为 ， 这 时 ， 就 引入 了 守护 线程 
的 概念 

threading 模块 支持 守护 线程 , 它们 是 这 样 工作 的 : 守护 线程 一 般 是 一 个 等 待 客户 请 求 的 服务 器 ， 
如 果 没 有 客户 提出 请 求 ， 它 就 在 那 等 着 。 如 果 你 设 定 一 个 线程 为 守护 线程 ， 就 表示 你 在 说 这 个 线程 
是 不 重要 的 ， 在 进程 退出 的 时 候 ， 不 用 等 待 这 个 线程 退出 。 就 像 你 在 第 16 章 网 络 编程 看 到 的 ， 服 务 
器 线程 运行 在 一 个 无 限 循环 中 ， 一 般 不 会 退出 。 

如 果 你 的 主线 程 要 退出 的 时 候 ， 不 用 等 待 那些 子 线程 完成 ， 那 就 设 定 这 些 线程 的 daemon 属性 。 
即 ， 在 线程 开始 (调用 thread. start () ) 之 前 ， 调 用 setDaemonO 函数 设 定 线程 的 daemon 标志 

(thread. setDaemon (True) ) 就 表示 这 个 线程 “不 重要 ” 

如 果 你 想 要 等 待 子 线程 完成 再 退出 ， 那 就 什么 都 不 用 做 ,或 者 显 式 地 调用 
thread. setDaemon (False) 以 保证 其 daemon 标志 为 False。 你 可 以 调用 thread. isDaemon () 函数 来 判 
BT daemon 标志 的 值 。 新 的 子 线程 会 继承 其 父 线程 的 daemon 标志 。 整 个 Python 会 在 所 有 的 非 守护 
线程 退出 后 才 会 结束 , 即 进 程 中 没有 非 守 护 线程 存在 的 时 候 才 结束 。 





18. 5. 1 Thread 类 














rate 











用 Thread 类 ， 你 可 以 用 多 种 方法 来 创建 线程 。 我 们 在 这 里 介绍 三 种 比较 相像 的 方法 。 你 可 以 任 
选 一 种 你 喜欢 的 ， 或 最 适合 你 的 程序 以 及 最 能 满足 程序 可 扩展 性 的 《我 们 一 般 比 较 喜 欢 最 后 一 个 选 


TO: 


e 创建 一 个 Thread 的 实例 ， 传 给 它 一 个 函数 
e 创建 一 个 Thread 的 实例 ， 传 给 它 一 个 可 调用 的 类 对 象 
@ 从 Thread 派生 出 一 个 子 类 ， 创 建 一 个 这 个 子 类 的 实例 











表 18. 3 Thread 对 象 的 函数 























函数 描述 

start () 开始 线程 的 执行 

run () 定义 线程 的 功能 的 函数 〈 一 般 会 被 子 类 重 写 ) 

join(timeout=None) 程序 挂 起 ， 直 到 线程 结束 ， 如 果 给 了 timeout， 则 最 多 阻塞 timeout f^ 
getName () 返回 线程 的 名 字 

setName (name) 设置 线程 的 名 字 

isAliveO 布尔 标志 ， 表 示 这 个 线程 是 否 还 在 运行 中 

isDaemon () 返回 线程 的 daemon 标志 
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setDaemon(daemonic) 把 线程 的 daemon 标志 设 为 daemonic( 定 要 在 调用 start O 函数 前 调用 ) 
创建 一 个 Thread 的 实例 ， 传 给 它 一 个 函数 














第 一 个 例子 的 中 ， 我 们 将 初始 化 一 个 Thread 对 象 ， 把 函数 〈 及 其 参数 ) 像 上 一 个 例子 那样 传 进 
去 。 在 线程 开始 执行 的 时 候 , 这 个 函数 会 被 执行 。 把 mtsleep2. py 脚本 拿 过 来 ,做 一 些 调整 加 入 Thread 
对 象 的 使 用 ， 就 成 了 例 18.4 中 的 mtsleep3. py。 


运行 的 输出 跟 之 前 很 相似 : 


$ mtsleep3. py 

starting at: Sun Aug 13 18:16:38 2006 
start loop 0 at: Sun Aug 13 18:16:38 2006 
start loop 1 at: Sun Aug 13 18:16:38 2006 
loop I done at: Sun Aug 13 18:16:40 2006 
loop 0 done at: Sun Aug 13 18:16:42 2006 
all DONE at: Sun Aug 13 18:16:42 2006 


那么 ,都 做 了 些 什么 修改 呢 ? 在 使 用 thread 模块 时 使 用 的 锁 没 有 了 。 新 加 了 一 些 Thread WR. 
在 实例 化 每 个 Thread 对 象 的 时 候 , 我 们 把 函数 (target) 和 参数 (args) 传 进去 , 得 到 返回 的 Thread 
实例 。 实 例 化 一 个 Thread (调用 Thread () ) 与 调用 thread. start new thread() 之 间 最 大 的 区 别 就 
是 ， 新 的 线程 不 会 立即 开始 。 在 你 创建 线程 对 象 ， 但 不 想 马 上 开始 运行 线程 的 时 候 ， 这 是 一 个 很 有 
用 的 同步 特性 。 











例 18. 4 使 用 threading 模块 (mtsleep3. py) 


threading 模块 的 Thread 类 有 一 个 join OO 函数 ， 人 允许 主线 程 等 竺 线程 的 结束 。 





7 #!//usr/bin/env python 

2 

3 import threading 

4 from time Import sleep, ctime 

5 

6 loops = [4 2] 

7 

8 def loop(nloop, nsec): 

9 print 'start loop’, nloop, 'at:', ctime() 
10 sleep (nsec) 

li print 'loop', nloop, 'done at:', ctime() 
12 

13 def main: 
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14 print 'starting at:', ctime( 
15 threads = /J 

16 nloops = range (len (loops)) 
17 

18 for i in nloops: 





19 t = threading. Thread (target=loop, 

20 args-(i, loops[i])) 

21 threads. append (t) 

22 

23 for i in nloops: # start threads 

24 threads[i/. start () 

25 

26 for i in nloops: # wait for all 

27 threads[i/. join # threads to finish 





28 

29 print 'all DONE at:’, ctime(Q 
30 

31 if name ==’ main 

32 main Q 








所 有 的 线程 都 创建 了 之 后 ， 再 一 起 调用 start O 函数 启动 ， 而 不 是 创建 一 个 启动 一 个 。 而 且 ， 
不 用 再 管理 一 堆 锁 ( 分 配 锁 , 获得 锁 , 释放 锁 , 检查 锁 的 状态 等 ) 只 要 简单 地 对 每 个 线程 调用 joinO 
函数 就 可 以 了 。 




















join () 会 等 到 线程 结束 ， 或 者 在 给 了 timeout 参数 的 时 候 ， 等 到 超时 为 止 。 使 用 join 看 上 去 
会 比 使 用 一 个 等 待 锁 释放 的 无 限 循 环 清楚 一 些 (这 种 锁 也 被 称 为 ”spinlock”) 














join() 的 另 一 个 比较 重要 的 方面 是 它 可 以 完全 不 用 调用 。 一 旦 线程 启动 后 ， 就 会 一 直 运 行 ， 直 
到 线程 的 函数 结束 ， 退 出 为 止 。 如 果 你 的 主线 程 除了 等 线程 结束 外 ， 还 有 其 它 的 事情 要 做 (如 处 理 
或 等 待 其 它 的 客户 请 求 ), 那 就 不 用 调用 join Os 只 有 在 你 要 等 待 线程 结束 的 时 候 才 要 调用 join () 。 























创建 一 个 Thread 的 实例 ， 传 给 它 一 个 可 调用 的 类 对 象 











与 传 一 个 函数 很 相似 的 另 一 个 方法 是 在 创建 线程 的 时 候 ， 传 一 个 可 调用 的 类 的 实例 供 线程 启动 
的 时 候 执行 一 一 这 是 多 线程 编程 的 一 个 更 为 面向 对 象 的 方法 。 相 对 于 一 个 或 几 个 函数 来 说 ， 由 于 类 
对 象 里 可 以 使 用 类 的 强大 的 功能 ， 可 以 保存 更 多 的 信息 ， 这 种 方法 更 为 灵活 。 











把 ThreadFunc 类 加 入 到 mtsleep3. py 代码 中 ， 并 做 一 些 其 它 的 小 修改 后 ， 就 得 到 了 例 18.5 中 
的 mtsleep4. py。 运 行 它 ， 就 会 得 到 如 下 的 输出 : 
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$ mtsleep4. py 

starting at: Sun Aug 13 18:49:17 2006 
start loop 0 at: Sun Aug 13 18:49:17 2006 
start loop 1 at: Sun Aug 13 18:49:17 2006 
loop I done at: Sun Aug 13 18:49:19 2006 
loop 0 done at: Sun Aug 13 18:49:21 2006 
all DONE at: Sun Aug 13 18:49:21 2006 














那么 ， 这 次 又 改 了 些 什么 呢 ? 主要 是 增加 了 ThreadFunc 类 和 创建 Thread 对 象 时 会 实例 化 一 个 
可 调用 类 ThreadFunc 的 类 对 象 。 也 就 是 说 , 我 们 实例 化 了 两 个 对 象 . 下 面 ,来 仔细 地 看 一 看 ThreadFunc 


类 吧 。 





我 们 想 让 这 个 类 在 调用 什么 函数 方面 尽量 地 通用 ， 并 不 局 限于 那个 loopO 函数 。 所 以 ， 我 们 加 
了 一 些 修改 ， 如 ， 这 个 类 保存 了 函数 的 参数 ， 函 数 本 身 以 及 函数 的 名 字 字 符 串 。 构 造 函 数 _init 0 
里 做 了 这 些 值 的 赋值 工作 。 











创建 新 线程 的 时 候 ，Thread 对 象 会 调用 我 们 的 ThreadPunc 对 象 ， 这 时 会 用 到 一 个 特殊 函数 
call _0 。 由 于 我 们 已 经 有 了 要 用 的 参数 ， 所 以 就 不 用 再 传 到 Thread) 的 构造 函数 中 。 由 于 我 们 
有 一 个 参数 的 元 组 , 这 时 要 在 代码 中 使 用 apply O 函数。 如 果 你 使 用 的 是 Pythonl. 6 或 是 更 高 版 本 ， 
$ 你 可 以 使 用 11. 6. 3 节 中 所 说 的 新 的 调用 语法 ， 而 不 用 像 第 16 行 那样 使 用 apply O 函数 : E 














self. res = self. func (*self. args) 


例 18.5 使 用 可 调用 的 类 (mtsleep4. py) 


此 例 中 ， 我 们 传 了 一 个 可 调用 的 类 (的 实例 ) ， 而 不 是 仅 传 一 个 函数 。 相 对 mtsleep3. py 中 的 方 
法 来 说 ， 这 样 做 更 有 具 面向 对 象 的 概念 。 


7 #!//usr/bin/env python 

2 

3 import threading 

4 from time import sleep, ctime 


5 

6 loops = [4 2] 

7 

8 class ThreadFunc (object): 
9 


10 def | init (self, func, args, name-''): 
1l self. name = name 
12 self. func = func 
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Edit By Vheavens 


Edit By Vheavens 


ee 
T | 


13 self. args = args 

14 

15 def call (self): 

16 apply (self. func, self. args) 
17 

18 def loop(nloop, nsec): 





19 print 'start loop’, nloop, 'at:', ctimeQ 
20 sleep (nsec) 

21 print 'loop', nloop, 'done at:', ctime() 
22 

23 def main(): 

24 print 'starting at:', ctime() 

25 threads = [] 

26 nloops = range (len (loops)) 

27 

28 for i in nloops: # create all threads 
29 t = threading. Thread ( 

30 target-ThreadFunc (loop, (i, loops[i/), 
31 loop. name J) 

32 threads. append (t) 

33 

34 for i in nloops: # start all threads 
35 threads[i/. start O 

36 

37 for i in nloops: # wait for completion 
38 threads[i/J. join O 





39 

40 print 'all DONE at:', ctime( 
41 

42 if name ==’ main 

43 main () 


J Thread 派生 出 一 个 子 类 ， 创 建 一 个 这 个 子 类 的 实例 





最 后 一 个 例子 介绍 如 何 子 类 化 Thread 类 ， 这 与 上 一 个 例子 中 的 创建 一 个 可 调用 的 类 非常 像 。 使 
用 子 类 化 创建 线程 (第 29-30 行 ) 使 代码 看 上 去 更 清晰 明了 。 我 们 将 在 例 18. 6 中 给 出 mtsleep5. py 
的 代码 ， 以 及 代码 运行 的 输出 。 比 较 mtsleep5. py 和 mtsleep4. py 的 任务 则 留 给 读者 做 为 练习 。 














下 面 是 mtsleep5. py 的 输出 ， 同 样 ， 跟 我 们 的 期 望 一 致 : 





$— E 
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$ mtsleepb5. py 

starting at: Sun Aug 13 19:14:26 2006 
start loop 0 at: Sun Aug 13 19:14:26 2006 
start loop 1 at: Sun Aug 13 19:14:26 2006 
loop 1 done at: Sun Aug 13 19:14:28 2006 
loop 0 done at: Sun Aug 13 19:14:30 2006 
all DONE at: Sun Aug 13 19:14:30 2006 








在 读者 比较 mtsleep4 和 mtsleep5 两 个 模块 的 代码 之 前 ， 我 们 想 指 出 最 重要 的 两 点 改变 : (1) 4X 
们 的 MyThread 子 类 的 构造 函数 一 定 要 先 调用 基 类 的 构造 函数 (第 9 fT). (2 之 前 的 特殊 函数 
. call 0 在 子 类 中 ， 名 字 要 改 为 fun() 。 








现在 ， 在 MyThread 类 中 ， 加 入 一 些 用 于 调试 的 输出 信息 ， 把 代码 保存 到 myThread 模块 中 ( 见 例 
18.7) ， 并 在 下 面 的 例子 中 ， 导 入 这 个 类 。 除 了 简单 地 使 用 apply O 函数 来 运行 这 些 函 数 之 外 ， 我 们 
还 把 结果 保存 到 实现 的 self. res 属性 中 ， 并 创建 一 个 新 的 函数 getResult 0 来 得 到 结果 。 




















18.5.4 斐 波 那 契 ， 阶 乘 和 累加 和 


例 18. 8 中 的 mtfacfib. py 脚本 比较 了 递归 求 斐 波 那 契 ， 阶 乘 和 累加 和 函数 的 运行 。 脚 本 先 在 
单线 程 中 运行 这 三 个 函数 ， 然 后 在 多 线程 中 做 同样 的 事 ， 以 说 明 多 线程 的 好 处 。 





例 18. 6 子 类 化 Thread (mtsleepb. py) 








我 们 现在 要 子 类 化 Thread X, 而 不 是 创建 它 的 实例 这 样 做 可 以 更 灵活 地 定制 我 们 的 线程 对 象 ， 
而 且 在 创建 线程 的 时 候 也 更 简单 。 








7 #!/usr/bin/env python 

2 

3 import threading 

4 from time import sleep, ctime 

b 

6 loops = (4, 2) 

7 

8 class MyThread (threading. Thread): 
9 def init (self, func, args, name=’): 
10 threading. Thread. | init (self) 
77 self. name = name 

12 self. func = func 

18 self. args = args 
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14 

15 def run(self): 

16 apply (self. func, self. args) 
17 

18 def loop(nloop, nsec): 





19 print 'start loop’, nloop, 'at:'/, ctime() 
20 sleep (nsec) 
21 print 'loop', nloop, 'done at:', ctime() 
22 
23 def main(): 
24 print 'starting at:', ctime() 
25 threads = {7 
26 nloops = range (len (loops)) 
27 
28 for i in nloops: 
29 t = MyThread(loop, (i, loops[i/), 
30 loop. name ) 
31 threads. append (t) 
32 
38 for i in nloops: 
34 threads[i/. start O 
35 
36 for i in nloops: 
37 threads[i/J. join O 





38 

39 print 'all DONE at:’, ctime Q’ 
40 

4l if name ==? main 

42 main () 


例 18. 7 MyThread 子 类 化 Thread (myThread. py) 


为 了 让 mtsleep5. py Hà, Thread 的 子 类 更 为 通用 ， 我 们 把 子 类 单独 放 在 一 个 模块 中 ， 并 加 上 一 
个 getResult O 函数 用 以 返回 函数 的 运行 结果 。 


7 #!/usr/bin/env python 
2 

3 import threading 

4 from time import ctime 
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6 class MyThread (threading. Thread): 

7 def init (self, func, args, name-''): 
8 threading. Thread. | init (self) 

9 self. name = name 

10 self. func = func 

ll self. args = args 

12 

13 def getResult (self): 

14 return self. res 

15 

16 def run(self): 

17 print ’starting’, self. name, 'at:', | 
18 ctime() 

19 self. res = apply (self. func, self. args) 





20 print self. name, “finished at:’, | 
21 ctime() 








在 单线 程 中 运行 只 要 简单 地 逐个 调用 这 些 函数 , 在 函数 结束 后 ， 显 示 对 应 的 结果 。 在 多 线程 中 ， 
我 们 不 马上 显示 结果 。 由 于 我 们 想 让 MyThread 类 尽 可 能 地 通用 (能 同时 适应 有 输出 和 没 输出 的 函数 ) ， 
我 们 会 等 到 要 结束 时 才 会 调用 getResult 0 函数 ， 并 在 最 后 显示 每 个 函数 的 结果 。 




















由 于 这 些 函 数 运行 得 很 快 〈 斐 波 那 契 函数 会 慢 一 些 )， 你 会 看 到 ， 我 们 得 在 每 个 函数 中 加 上 一 
个 sleep 0 函数 ， 让 函数 慢 下 来 ， 以 便于 我 们 能 方便 地 看 到 多 线程 能 在 多 大 程度 上 加 速 程序 的 运行 。 
不 过 实际 工作 中 ， 你 一 般 不 会 想 在 程序 中 加 上 sleep 0 函数 的 。 下 面 是 程序 的 输出 : 








$ mtfacfib.py 

xxx SINGLE THREAD 

starting fib at: Sun Jun 18 19:52:20 2006 
233 

fib finished at: Sun Jun 18 19:52:24 2006 


例 18. 8 裴 波 那 契 ， 阶 乘 和 累加 和 (mtfacfib. py) 





在 这 个 多 线程 程序 中 ， 我 们 会 分 别 在 单线 程 和 多 线程 环境 中 ， 运 行 三 个 递归 函数 。 


7 #l/usr/bin/env python 
2 
3 from myThread import MyThread 


4 from time import ctime, sleep 
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6 def fib(x): 

7 sleep (0. 005) 

8 if x < 2: return 1 

9 return (fib(x-2) + fib(x-1)) 
10 

ll def fac(x): 

12 sleep (0. 1) 

18 if x < 2: return 1 
14 return (x * fac(x-1)) 
15 

16 def sum(x): 

17 sleep (0. 1) 

18 if x < 2: return 1 
19 return (x * sum(x-1)) 





20 

21 funcs = [fib, fac, sum] 
22 n = 12 

23 


24 def main(): 

25 nfuncs = range (len (funcs)) 
26 

27 print '*** SINGLE THREAD’ 

28 for i in nfuncs: 

29 print 'starting , funcs[i/. name , 'at:', | 
30 ctime() 

31 print funcs[iJ (n) 

32 print funcs[i/. name , 'finished at:’, | 
33 ctime() 

34 

35 print ' \n#** MULTIPLE THREADS" 
36 threads = [] 

37 for i in nfuncs: 

38 t = MyThread(funcs[i/, (n, ), 
39 funes[i/. name ) 

40 threads. append (t) 

4] 

42 for i in nfuncs: 

43 threads[ iJ. start O 

44 

45 for i in nfuncs: 
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46 threads[ iJ. join Q 
47 print threads[1/. getResult () 








48 

49 print ’all DONE’ 

50 

51 if name  -- ' main 
52 main Q) 


starting fac at: Sun Jun 18 19:52:24 2006 
479001600 

fac finished at: Sun Jun 18 19:52:26 2006 
starting sum at: Sun Jun 18 19:52:26 2006 
78 

sum finished at: Sun Jun 18 19:52:27 2006 


xxx MULTIPLE THREADS 


starting fib at: Sun Jun 18 19:52:27 2006 
starting fac at: Sun Jun 18 19:52:27 2006 
starting sum at: Sun Jun 18 19:52:27 2006 
233 
479001600 
78 

all DONE 


18.5.5 threading 模块 中 的 其 它 函 数 














除了 各 种 同步 对 象 和 线程 对 象 外 ，threading 模块 还 提供 了 一 些 函 数 。 见 表 18. 4. 





表 18. 4 threading 模块 的 函数 


函数 描述 

activeCount () 当前 活动 的 线程 对 象 的 数量 
currentThread() ”返回 当前 线程 对 象 

enumerate () 返回 当前 活动 线程 的 列表 
settrace(func)* 为 所 有 线程 设置 一 个 跟踪 函数 
setprofile (func)” 为 所 有 线程 设置 一 个 profile HA 





a. Python 2.3 新 增 
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18.5.5 生产 者 -消费 者 问题 和 Queue 模块 














Um 个 例子 演示 了 生产 者 和 消费 者 的 场景 。 生 产 者 生产 货物 ， 然 后 把 货物 放 到 一 个 队列 
类 的 数据 结构 中 ， NE, 者 物 所 要 花费 的 时 间 无 法 预先 确定 。 消 费 者 消耗 生产 者 生产 
(RTT AE 定 的 。 
































表 18.5 常用 的 Queue 模块 的 属性 




















函数 描述 
Queue 模块 函数 
queue (size) 创建 一 个 大 小 为 size 的 Queue 对 象 
Queue 对 象 函数 
qsize() 返回 队列 的 大 小 《由 于 在 返回 的 时 候 ， 队 列 可 能 会 被 其 它 线程 修改 ， 所 以 这 个 
值 是 近似 值 ) 
empty Q 如 果 队 列 为 空 返回 True， 否 则 返回 False 
full O 如 果 队 列 已 满 返 回 True， 否 则 返回 False 
put (item, 
block-0) 把 item 放 到 队列 中 ， 如 果 给 了 block〔( 不 为 0)， 函 数 会 一 直 阻 寒 到 队列 中 有 E: 
空间 为 止 
get(block-0) ”从 队列 中 取 一 个 对 象 ， 如 果 给 了 block( 不 为 0)， 函 数 会 一 直 阻 塞 到 
队列 中 有 对 象 为止 








Queue 模块 可 以 用 来 进行 线程 间 通 讯 ， 让 各 个 线程 之 间 共 享 数 据 。 现 在 ， 我 们 创建 一 个 队列 ， 让 
生产 者 (线程) 把 新 生产 的 货物 放 进 去 供 消费 者 〈 线 程 ) 使 用 。 要 达到 这 个 目的 , 我 们 要 使 用 到 Queue 
模块 的 以 下 属性 ( 见 表 18. 5)。 























很 容易 地 ， 我 们 就 能 写 出 例 18. 9 的 prodcons. py 的 代码 。 
下 面 是 这 个 脚本 的 运行 输出 : 


$ prodcons. py 
starting writer at: Sun Jun 18 20:27:07 2006 


producing object for Q... size now 1 
starting reader at: Sun Jun 18 20:27:07 2006 
consumed object from Q... size now 0 
producing object for Q... size now 1 
consumed object from Q... size now 0 
producing object for Q... size now 1 
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producing object for Q... size now 2 
producing object for Q... size now 3 
consumed object from Q... size now 2 
consumed object from Q... size now 1 

writer finished at: Sun Jun 18 20:27:17 2006 
consumed object from Q... size now 0 

reader finished at: Sun Jun 18 20:27:25 2006 
all DONE 





如 你 所 见 ， 生 产 者 和 消费 者 不 一 定 是 轮流 执行 的 《多 亏 有 了 随机 数 !)。 实 际 上 ， 真 实生 活 总 是 
充满 了 随机 性 和 不 确定 性 。 

















逐 行 解释 


1-6 行 

在 这 个 模块 中 ， 我 们 要 使 用 Queue. Queue 对 象 以 及 我 们 在 例 18.7 中 给 出 的 的 线程 类 
myThread. MyThread。 我 们 将 使 用 random. randint O 函数 来 随机 的 进行 生产 和 消耗 。 并 从 time 模块 
中 导入 了 名 用 的 属性 。 








—— 





8-16 fT 
writeQO 和 reada O 函数 分 别 用 来 把 对 象 放 入 队列 和 消耗 队列 中 的 一 个 对 象 。 在 这 里 我 们 使 用 E 
FAFA? xxx 来 表示 队列 中 的 对 象 。 


18-26 47 

writer O 函数 只 做 一 件 事 ， 就 是 一 次 往 队 列 中 放 入 一 个 对 象 ， 等 待 一 会 ， 然 后 再 做 同样 的 事 ， 
一 共 做 指定 的 次 数 ， 这 个 次 数 是 由 脚本 运行 时 随机 生成 的 。reader 0 函数 做 的 事 比 较 类 似 ， 只 是 它 
是 用 来 消耗 对 象 的。 











你 会 注意 到 ，writer 睡眠 的 时 间 一 般 会 比 reader 睡眠 的 时 间 短 。 这 可 以 减少 reader 尝试 从 空 
队列 中 取 数 据 的 机 会 。writer 的 睡眠 时 间 短 ， 那 reader 在 想 要 数据 的 时 候 总 是 能 拿 到 数据 。 








28-29 行 
设置 有 多 少 个 线程 要 被 运行 。 








Bil 18.9 生产 者 一 消费 者 问题 (prodcons. py) 


这 个 实现 中 使 用 了 Queue 对 象 和 随机 地 生产 《和 消耗 ) 货物 的 方式 。 生 产 者 和 消费 者 相互 独立 
并 且 并 发 地 运行 。 


1#!/usr/bin/env python 


$— 一 * 一 
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2 


3from random import randint 





4from time import sleep 

from Queue import Queue 

6from myThread import MyThread 

7 

Sdef writeQ (queue); 

9print 'producing object for @..’, 
10  queue.put( xxx’, 1) 

li print “size now’, queue. qsize( 
12 

13 def readQ (queue) : 

14 val = queue. get (1) 

15 print 'consumed object from Q... size now’, 
16 queue. qsize 0 

17 

18 def writer (queue, loops): 

19 for i in range(loops): 

20 writeQ (queue) 

21 sleep(randint (1, 3)) 

22 

23 def reader (queue, loops): 
24 for i in range (loops): 

25 read (queue) 

26 sleep(randint (2, 5)) 

27 

28 funcs = [writer, reader] 

29 nfuncs = range(len(funcs)) 
30 

31 def main Q: 

32  nloops = randint (2, 5) 

33  q = Queue (32) 

34 

35 threads = 17 

36 for i in nfuncs: 

37 t = MyThread(funcsíi], (a, nloops), 
38  funcsíi]. name ) 

39 threads. append (t) 

40 

for i in nfuncs: 














Edit By Vheavens 


Edit By Vheavens 


eo 





42 threads[i/. start Q 


44 for i in nfuncs: 

45  threads[iJ. join 

46 

47 print ’all DONE 

48 

49 if name  -- ' main 
50 main() 





31-47 1T 
最 后 ， 就 到 了 mainO 函数 ， 它 与 之 前 的 所 有 脚本 的 main O 函数 都 很 像 。 先 是 创建 所 有 的 线程 ， 
然后 运行 它们 ， 最 后 ， 等 两 个 线程 都 结束 后 ， 得 到 最 后 的 运行 结果 。 
































从 本 例 中 ， 我 们 可 以 了 解 到 ， 一 个 要 完成 多 项 任务 的 程序 ， 可 以 考虑 每 个 任务 使 用 一 个 线程 。 
这 样 的 程序 在 设计 上 相对 于 单线 程 做 所 有 事 的 程序 来 说 ， 更 为 清晰 明了 。 











本 章 中 ， 我 们 看 到 了 单线 程 的 程序 在 程序 性 能 上 的 限制 。 尤 其 在 有 相互 独立 的 ， 运 行 时 间 不 确 
定 的 多 个 任务 的 程序 里 ， 把 多 个 任务 分 隔 成 多 个 线程 同时 运行 会 比 顺序 运行 速度 更 快 。 由 于 Python 
解释 器 是 单线 程 的 ， 所 以 不 是 所 有 的 程序 都 能 从 多 线程 中 得 到 好 处 。 不 过 ， 你 已 经 对 Python 下 的 $ 














多 线程 有 所 了 解 ， 在 适当 的 时 候 ， 可 以 利用 它 来 改善 程序 的 性 能 





18. 6 相关 模块 


下 表 列 出 了 一 些 多 线程 编程 中 可 能 用 得 到 的 模块 : 


表 18.6 多 线程 相关 的 标准 库 模块 

模块 描述 

thread 基本 的 ， 底 级 别 的 线程 模块 

threading ”高 级 别 的 线程 和 同步 对 象 

Queue ” 供 多 线程 使 用 的 同步 先进 先 出 (FIF0〉 队 列 
mutex HFA 

SocketServer ”具有 线程 控制 的 TCP 和 UDP 管理 器 























18.7 练习 


-1， 进 程 与 线程 。 线 程 与 进程 的 区 别 是 什么 ? 
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18-2. Python 的 线程 。 在 Python 中 ， 哪 一 种 多 线程 的 程序 表现 得 更 好 ，1/0 密集 型 的 还 是 计算 
密集 型 的 ? 





18-3. 线程 。 你 认为 ， 多 CPU 的 系统 与 一 般 的 系统 有 什么 大 的 不 同 ? 多 线程 的 程序 在 这 种 系统 
上 的 表现 会 怎么 样 ? 





18-4. 线程 和 文件 。 把 练习 9-19 的 答案 做 一 些 改 进 。 我 们 要 得 到 一 个 字 贡 值 ， 一 个 文件 名 
然后 显示 在 文件 中 那个 字 布 出 现 了 多 少 次 。 假 设 这 个 文件 非常 的 天。 文件 是 可 以 有 多 个 
读者 的 ， 那 我 们 就 可 以 创建 多 个 线程 ， 每 个 线程 负责 文件 的 一 部 分 。 最 后 ， 把 所 有 的 线程 
的 结果 相 加 。 使 用 timeit () 对 单线 程 和 多 线程 分 别 进行 计时 ， 对 性 能 的 改进 进行 讨论 。 











18-5， 线 程 ， 文 件 和 正则 表达 式 。 你 有 一 个 非常 大 的 mailbox 文件 一 一 如 果 没有 的 话 ， 你 可 以 
把 你 所 有 的 e-mail 的 原始 信息 放 到 一 个 文本 文件 中 。 你 现在 要 做 的 是 ， 使 用 你 在 15 章 写 的 
识别 e-mail 地 址 和 网 页 URL 的 正则 表达 式 ， 分 析出 这 个 大 文件 里 的 所 有 的 e-mail 地 址 和 URL， 
把 这 些 链接 写 到 一 个 . html (或 . hem) 文件 中 。 在 这 个 文件 生成 时 ， 会 自动 显示 一 个 浏览 器 ， 
打开 这 个 文件 ， 显 示 所 有 的 链接 。 使 用 多 线程 来 分 隔 处 理 大 文件 和 把 结果 写 到 一 个 新 的 

.html 文件 的 操作 。 在 浏览 器 中 测试 一 下 你 的 结果 ， 确 保 那些 链接 都 能 正常 工作 。 









































18-6. 线程 和 网 络 。 你 在 之 前 做 的 聊天 服务 器 程序 (练习 16-7 到 16-10) 也 许 会 用 到 重量 


级 线程 或 者 说 进程 ， 把 那个 代码 改 成 多 线程 的 。 
18-7.* 线 程 和 Web 编程 。 练 习 19. 1 中 的 爬虫， 是 一 个 单线 程 的 网 页 下 载 程序 ， 但 可 以 利用 


多 线程 提高 性 能 。 
修改 crawl. py CREJ LAIU È mtcrawl. py)， 让 它 可 以 使 用 多 个 不 相关 的 线 
程 来 下 载 网 页 。 注 意 要 使 用 某 种 锁 的 机 制 以 确保 不 会 在 访问 链接 队列 的 时 候 出 现 访问 冲突 。 
































18-8. 线程 池 。 修 改 例 18. 9 的 代码 ， 不 再 是 一 个 生产 者 和 一 个 消费 者 ， 而 是 可 以 有 任意 个 
消费 者 线程 〈 一 个 线程 池 )， 每 个 线程 可 以 在 任意 时 刻 处 理 或 消耗 任意 多 个 产品 。 











18-9. 文件 。 创 建 一 些 线程 来 计算 一 些 ( 可 能 很 大 量 的 ) 文件 中 一 共有 多 少 行 。 你 可 以 选择 
要 使 用 多 少 个 线程 。 比 较 单 线程 与 多 线程 的 性 能 差异 。 提 示 : 回顾 一 下 第 9 章 〈 文 件 和 输入 
输出 ) 的 练习 。 








18-10. 把 你 之 前 的 解决 方案 应 用 到 你 选择 的 几 个 任务 中 ， 如 ， 处 理 一 些 e-mail， 下 载 一 些 
网 页 ， 处 理 一 些 RSS 和 Atom feeds， 聊 天 时 的 消息 处 理 ， 解 一 个 迷 题 等 。 
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图 形 用 户 界面 编程 





qi 
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引言 

Tkinte 与 Python 编程 

Tkinter 模块 

Tk 组 件 库 

Tkinter 使 用 举例 

标签 、 按 钮 与 进度 条 组 件 

一 个 使 用 Tk 的 中 级 范例 

其 他 GUI 简介 (Tix, Pmw, wxPython, PyGTK) 
相关 模块 和 其 他 GUI 


eeeeeeeg@e@ 9 + 














Edit By Vheavens 


Edit By Vheavens 


e zr y 
T | T 


Chapter 1 U 


本 章 我 们 将 对 图 形 用 户 界 面 (GUI) 进行 简介 。 不 论 您 是 初次 涉及 该 领域 还 是 想 学 到 更 多 ， 抑 或 
只 是 想 看 看 Python 是 如 何 做 的 ， 这 一 章 都 会 适合 您 。 在 这 短 短 的 一 章 里 我 们 无 法 对 GUI 程序 开发 介 
绍 得 面面俱到 ， 但 我 们 将 给 您 讲解 最 核心 的 内 容 。Python 的 默认 GUI 工具 集 是 Tk， 它 也 是 我 们 将 使 

的 最 基本 的 GUI 工具 集 ， 我 们 可 以 通过 Python 接口 Tkinter 来 使 用 Tk (Tkinter IE: “Tk 接口 ” 




















aH 


e E 
Tk 并 非 “ 最 强 、 最 新 ”也 不 是 包含 GUI 构建 模块 最 多 的 工具 集 ， 但 它 非 常 简 单 ， 并 且 可 以 开发 
出 能 运行 于 大 多 数 平台 的 GUI 程序 。 我 们 将 用 Tkinter 举 几 个 例子 其 中 包括 一 个 中 级 范例 ， 随 后 我 
们 还 将 给 出 几 个 其 他 工具 集 的 例子 。 一 旦 完成 了 本 章 的 学 习 ， 您 将 掌握 构建 复杂 应 用 程序 的 技巧 ， 
也 有 能 力 转向 那些 更 流行 的 图 形 工具 集 。Python 有 许多 对 主流 工具 集 的 绑 定 (Binding) 或 转 接 
(Adaptor) ， 其 中 不 乏 对 商业 系统 的 ， 这 里 就 不 多 介绍 了 。 





























19. 1 简介 


19. 1.1 什 么 是 Tcl、Tk 和 Tkinter? 











Tkinter 是 Python 的 默认 GUI 库 ， 它 基于 Tk 工具 集 ， 后 者 最 初 是 为 工具 命令 语言 (Tcl1) 设计 
Hj. Tk 流行 后 被 移植 到 许多 其 他 脚本 语言 中 ， 包 括 Perl(Perl/Tk). Ruby (Ruby/Tk) 和 Python 
(CTkinter) 。 借 助 于 Tk 开发 GUI 的 可 移植 性 和 灵活 性 ， 加 上 脚本 语言 的 简洁 和 系统 语言 的 强劲 ， 我 
们 得 到 了 一 件 可 与 商业 软件 相 匹敌 的 利器 ， 它 可 以 用 于 快速 开发 各 种 GUI 程序 。 














如 果 是 初 涉 GUI 编程 ， 您 会 惊 言 地 发 现 一 切 竞 如 此 简单 。 您 也 会 发 现 Python 搭配 Tkinter 提供 
了 一 种 高 效 的 、 激 动人 心 的 应 用 程序 构建 方式 ， 可 以 用 来 开发 出 有 趣 〈 并 且 往 往 还 有 用 ) 的 程序 。 
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而 同样 的 程序 如 果 直 接 使 用 C/C++， 基 于 本 地 窗口 系统 库 开发 将 多 花 很 长 的 时 间 。 一 旦 设计 好 了 程序 
及 相应 外 观 ， 您 接 下 来 要 做 的 只 是 用 那些 被 称 作 组 件 的 基本 构造 块 去 搭建 想 要 的 模块 ， 最 终 再 赋予 
其 功能 就 能 让 一 切 “ 活 起 来 ”。 























如 果 您 是 个 Tk 老手 ， 不 论 是 使 用 过 Tcl 还 是 Per1， 都 会 发 现 Python 提供 了 一 种 进行 GUI 编程 
的 全 新 方式 。Python 基于 Tk 提供 了 一 种 更 高 效 的 快速 原型 系统 用 以 创建 应 用 。 别 忘 了 您 同时 还 享有 
Python 的 系统 访问 、 网络 操作 、XML、 数字 可 视 化 、 数据库 访问 、 以 及 所 有 其 他 标准 库 和 第 三 方 模块 。 


























一 旦 您 在 自己 的 系统 中 装 好 了 Tkinter, 用 不 了 15 分 钟 就 可 以 让 您 的 第 一 个 GUI 程序 运行 起 来 ! 
19. 1. 2 安装 和 使 用 Tkinter 


类 似 于 线程 模块 ， 您 系统 中 的 Tkinter 未 必 是 默认 开启 的 。 您 可 以 通过 尝试 导入 Tkinter 模块 
来 判断 它 是 否 能 被 Python 解释 器 使 用 。 如 果 Tkinter 是 可 用 的 ， 不 会 出 现任 何 错误 : 


222 import Tkinter 
222 


而 如 果 您 的 Python 解释 器 在 编译 时 没有 局 用 Tkinter， 导 入 过 程 将 失败 。 


222 import Tkinter 
Traceback (innermost last): 
File "Xstuin^', line l, in ? 
File “/usr/lib/pythonl. 5/lib-tk/Tkinter. py”, line 8, in ? 
import _tkinter # If this fails your Python may not be configured for Tk 


ImportError: No module named  tkinter 


这 时 您 不 得 不 重 编译 Python 解释 器 来 访问 Tkinter。 这 通常 会 涉及 编辑 Modules/Setup 文件 和 
启用 所 有 正确 选项 来 编译 您 的 Python 解释 器 ， 以 确保 Tkinter 能 被 选择 安装 在 系统 中 。 请 检查 您 
Python 发 行 包 中 的 README 文件 ， 里 面 有 把 Tkinter 编译 进 系统 的 操作 说 明 。 请 确定 您 编译 完 后 启动 
的 是 刚刚 创建 的 新 Python 解释 器 ， 否 则 它 会 像 那 个 旧 的 不 售 Tkinter 的 解释 器 一 样 工 作 〈 实 际 上 ， 
它 就 是 您 那个 旧 解 释 器 )。 

































































19.1.3 客户 端 /服务 器 架构 


在 之 前 介绍 的 网 络 编程 中 ， 我 们 介绍 了 客户 端 /服务 器 计算 模式 的 概念 。 窗 口 系统 就 是 软件 服务 
器 的 另 一 个 例子 ， 它 们 运行 在 一 个 有 显示 设备 的 机 器 上 ， 比 如 带 有 一 个 某 种 类 型 的 显示 器 。 当 然 还 
有 客户 端 〈 那 些 需 要 窗口 环境 来 运行 的 程序 ， 也 就 是 我 们 所 说 的 GUI 程序 )， 这 些 程序 无 法 脱离 窗口 
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系统 单独 运行 。 











这 种 架构 混合 网 络 应 用 将 显得 更 加 有 趣 。 通 常 一 个 GUI 程序 被 执行 时 会 在 局 动 它 的 机 器 上 显示 
《通过 窗口 服务 器 )， 但 也 可 以 在 一 些 网 络 化 的 窗口 环境 中 《例如 Unix 的 X Window 系统 ) 选择 其 它 
机 器 的 窗口 服务 器 去 显示 。 这 样 ， 您 就 可 以 在 一 台 机 器 上 运行 GUI 程序 而 在 另 一 台 机 器 上 显示 它 ! 





19.2 Tkinter 与 Python 编程 
19.2.1 Tkinter 模块 :把 Tk 引入 您 的 程序 























为 了 让 Tkinter 成 为 您 程序 的 一 部 分 ,应 该 怎么 做 昵 ? 这 并 不 是 说 您 一 定 要 先 有 一 个 应 用 程序 。 
只 有 您 愿意 ， 当 然 可 以 创建 一 个 纯粹 的 GUI 程序 ， 但 如 果 没有 让 人 感 兴趣 的 功能 的 话 ， 这 个 程序 也 
许 不 会 很 有 用 。 


























要 创建 并 运行 您 的 GUI 程序 ， 下 面 五 步 是 基本 的 : 


1. 导入 Tkinter 模块 (import Tkinter， 或 者 ，from Tkinter import *). 
2. 创建 一 个 顶层 窗口 对 象 ， 来 容纳 您 的 整个 GUI 程序 。 
3. 在 您 的 顶层 窗口 对 象 上 (或 者 说 在 “其 中 ”) 创建 所 有 的 GUI 模块 (以 及 功能 )。 








4. JERE GUI 模块 与 底层 程序 代码 相连 接 。 
5. ”进入 主事 件 循环 。 





第 一 步 很 明显 : 所 有 使 用 Tkinter 的 GUI 程序 必须 先导 入 Tkinter 模块 。 第 一 步 就 是 为 了 获得 
Tkinter 的 访问 权 ( 参 加 19. 1.1 小节)。 





19.2.2 GUI 程序 开发 简介 


在 举例 之 前 ， 我 们 将 先 从 宏观 上 来 给 您 简单 介绍 一 下 GUI 程序 开发 。 这 将 给 您 以 后 的 学 习 提供 
些 必要 的 背景 知识 。 


























创建 GUI 程序 与 画家 作画 有 些 相似 。 通 常 画 家 只 会 在 一 块 画 布 上 开展 自己 的 创作 。 工 作 步 又 或 
许 是 这 样 的 ;首先 要 找 来 一 块 干 净 的 石板 ， 您 将 在 这 个 “顶层 ” 窗 口 对象 上 创建 所 有 其 他 模块 。 可 
以 把 这 一 步 想象 成 一 座 房屋 的 地 基 或 者 某 个 画家 的 画 架 。 换 言 之 ， 在 搭建 各 实物 或 展开 画布 之 前 ， 
您 必须 先 给 地 基 浇 灌 好 混凝土 或 者 架 好 画 架 。 对 Tkinter 而 言 ， 这 个 基础 被 称 为 顶层 窗口 对 象 。 


























在 GUI 程序 中 ， 会 有 一 个 顶层 根 窗口 对 象 ， 它 包含 着 所 有 小 窗口 对 象 ， 它 们 共同 组 成 一 个 完整 
的 GUI 程序 。 这 些小 窗口 对 象 可 以 是 文字 标签 、 按 钮 、 列 表 框 等 等 。 这 些 独立 的 GUI 构件 就 是 所 谓 
的 组 件 。 所 以 当 我 们 说 创建 一 个 顶层 窗口 的 时 候 , 我 们 实际 上 是 指 您 需要 一 个 放置 所 有 组 件 的 地 方 。 
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典型 的 Python 语句 如 下 行 : 





top = Tkinter. TK. # WFLX “from Tkinter import *^ IkOL£ y 


Tkinter. Tk O 返回 的 对 象 通常 被 称 作 根 窗 口 , 正 因为 如 此 ,有 些 程序 用 root 来 指示 它 , ME top. 
顶层 窗口 是 指 那些 在 您 的 程序 中 独立 显示 的 部 分 。 您 可 以 在 GUI 程序 中 创建 多 个 顶层 窗口 ， 但 它们 
中 只 能 有 一 个 是 根 窗口 。 您 可 以 采用 先 完全 设计 好 组 件 再 添加 实际 功能 的 开发 方式 ， 也 可 以 二 者 同 
时 进行 。( 这 意味 着 交替 执行 上 述 五 步 中 的 第 三 步 和 第 四 步 。) 























组 件 既 可 以 是 独立 的 也 可 以 作为 容器 存在 。 如 果 一 个 组 件 “ 包 含 ” 其 他 组 件 ， 它 就 被 认为 是 这 





些 组 件 的 父 组 件 。 相 应 地 ， 如 果 一 个 组 件 被 “包含 ”在 其 他 组 件 中 ， 它 就 被 认为 是 父 组 件 的 孩子 ， 
父 组件 则 是 直接 包围 其 外 的 那个 容器 组 件 。 








通常 ， 组 件 会 有 一 些 相 应 的 行为 ， 例 如 按钮 被 按 下 ， 或 者 文本 框 被 写 入 。 这 种 形式 的 用 户 行为 
被 称 为 事件 ， 而 GUI 程序 对 事件 所 采取 的 响应 动作 被 称 为 回调 。 











用 户 操作 包括 按 下 〈 以 及 释放 ) 按钮 、 移 动 鼠 标 、 按 下 RETURN 或 Enter 键 等 等 ， 所 有 的 这 些 从 
系统 角度 都 被 看 作 事件 。GUI 程序 正 是 由 这 伴随 其 始末 的 整套 事件 体系 所 驱动 的 。 这 个 过 程 被 称 作 事 
件 驱 动 处 理 。 




















一 个 事件 及 其 回调 的 例子 是 鼠标 移动 。 我 们 假设 鼠标 指针 停 在 您 GUI 程序 的 某 处 。 如 果 鼠 标 被 $ 
移 到 了 程序 的 别处 ， 一 定 是 有 什么 东西 引起 了 屏幕 上 指针 的 移动 ， 从 而 表现 这 种 位 置 的 转移 。 系 统 

必须 处 理 这 些 鼠 标 移动 事件 才能 展现 (并 实现 ) 鼠标 在 窗口 上 的 移动 。 一 旦 您 释放 了 鼠标 ， 就 不 再 

会 有 事件 需要 处 理 ， 相 应 地 ， 屏 幕 上 的 一 切 又 复归 平静 。 












































GUI 程序 的 事件 驱动 特性 恰好 体现 出 它 的 客户 端 /服务 器 架构 。 当 您 启动 一 个 GUI 程序 时 ， 它 必 
须 执行 一 些 初始 化 例 程 来 为 核心 功能 的 运行 做 准备 ， 正 如 启动 一 个 网 络 服务 器 时 必须 先 申请 一 个 套 
接 字 并 把 它 绑 定 在 一 个 本 地 地 址 上 一 样 。Tk 有 两 个 坐标 管理 器 用 来 协助 把 组 件 放 在 正确 的 位 置 上 ; 
您 将 经 常用 到 的 一 个 称 为 “ 包 ” 亦 即 packer 。 另 一 个 坐标 管理 器 是 网 格 〈Grid) 一 您 可 以 用 它 来 把 
GUI 组 件 放 在 网 格 坐标 系 中 ，Grid 将 依据 GUI 中 的 网 格 坐 标 来 生成 每 个 对 象 。 我 们 将 紧 扣 packer Wf 


解 。 















































一 旦 packer 决定 好 您 所 有 组 件 的 尺寸 和 对 齐 方式 ， 它 将 为 您 在 屏幕 上 放置 它们 。 当 所 有 这 些 组 
件 ， 包 括 顶 层 窗口 ， 最 终 显示 在 您 屏幕 上 时 ，GUI 程序 就 会 进入 一 个 “服务 器 式 ” 的 无 限 循环 。 这 个 
无 限 循环 包括 等 待 GUI 事件 、 处 理事 件 、 然 后 返回 等 待 模式 ， 等 待 下 一 个 事件 。 


























上 述 最 后 一 步 说 明 所 有 组 件 就 绪 后 立即 进入 主 循环 。 这 正 是 我 们 提 及 的 “服务 器 式 ” 无 限 循环 。 
Xf Tkinter Ma, ， 相 应 代码 如 下 : 


Tkinter. mainloop 0 
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这 通常 是 您 程序 执行 的 最 后 一 段 代码 。 一 旦 进入 主 循环 ，GUI 便 从 此 掌握 控制 权 。 所 有 其 他 动作 
都 来 自 回调 函 数 ， 包 括 程序 退出 。 当 您 拉 下 文件 菜单 点 击 “ 退 出 ” 沫 单项 或 直接 关闭 窗口 时 ， 必 须 
要 唤起 一 个 回调 来 结束 您 的 程序 。 
































19.2.3 顶层 窗口 : Tkinter. TkO 








我 们 前 面 提 到 所 有 的 主要 组 件 都 建立 在 顶层 窗口 对 象 内 。 这 个 对 象 是 由 Tkinter 中 的 Tk 类 创建 
的 ， 并 且 是 由 普通 构造 函数 创建 的 : 














222 import Tkinter 
2»? top = Tkinter. Tk 0 


在 这 个 窗口 中 , 您 可 以 放置 独立 组 件 或 集成 的 模块 来 构建 您 的 GUI。 那么 , 都 有 哪些 组 件 可 用 呢 ? 
我 们 下 面 就 来 介绍 Tk 组 件 。 





19.2.4 Tk 组件 


Tk 目前 有 15 种 组 件 。 我 们 在 表 19. 1 中 列 出 了 它们 。 E 


我 们 不 准备 对 所 有 Tk 组 件 都 一 一 详细 讲解 ， 因 为 已 经 有 许多 关于 它们 的 很 好 的 文章 可 供 参 考 一 
不 论 是 从 Python 网 站 的 Tkinter 主题 页 面 还 是 数量 可 观 的 Tcl/Tk 印刷 品 ， 抑 或 是 在 线 资 源 〈 其 中 
一 些 可 以 在 附录 PB 中 找到 )。 然 而 ， 我 们 将 讲解 一 些 例子 来 帮 您 启 航 。 


























LIEFE: RABEL 
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组 件 ”描述 

Button 按钮。 类 似 标签 ， 但 提供 额外 的 功能 ， 例 如 鼠标 掠 过 、 按 下 、 释 放 以 及 键盘 操作 /事件 
Canvas ”画布 。 提 供 绘 图 功能 (直线 、 椭 圆 、 多 边 形 、 和 矩形 )， 可 以 包含 图 形 或 位 图 
Checkbutton 选择 按钮 。 一 组 方 框 ， 可 以 选择 其 中 的 任意 个 (类 似 HTML 中 的 checkbox) 

Entry ”文本 框 。 单 行文 字 域 ， 用 来 收集 键盘 输入 类 似 HTML 中 的 text) 

Frame ”框架 。 包 含 其 他 组 件 的 纯 容器 
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Label ”标签 。 用 来 显示 文字 或 图 片 

Listbox 列表 框 。 一 个 选项 列表 ， 用 户 可 以 从 中 选择 

Menu ”菜单 。 点 下 菜单 按钮 后 弹出 的 一 个 选项 列表 ， 用 户 可 以 从 中 选择 

Menubutton 菜单 按钮 。 用 来 包含 亲 单 的 组 件 (有 下 拉 式 、 层 车 式 等 等 ) 

Message 消息 框 。 类 似 于 标签 ， 但 可 以 显示 多 行文 本 

Radiobutton 单 选 按 钮 。 一 组 按钮 ， 其 中 只 有 一 个 可 被 “ 按 下 ”( 类 似 HTML 中 的 radio) 
Scale ”进度 条 。 线 性 “ 滑 块 ” 组 件 ， 可 设 定 起 始 值 和 结束 值 ， 会 显示 当前 位 置 的 精确 值 
Scrollbar ” 演 动 条 。 对 其 支持 的 组 件 ( 文 本 域 、 画 布 、 列 表 框 、 文 本 框 ) 提供 滚动 功能 
Text ”文本 域 .多 行文 字 区 域 , 可 用 来 收集 (或 显示 ) 用 户 输入 的 文字 (类 似 HTML 中 的 textarea) 
Toplevel 顶级 。 类 似 框架 ， 但 提供 一 个 独立 的 窗口 容器 。 


























< 
Bl 19. 1. 标签 组 件 演示 (tkhellol. py) 





我 们 的 第 一 个 Tkinter 例子 是 ...... 还 能 是 什么 昵 ? “Hello World!” 具 体 地 说 ， 是 介绍 我 们 
的 第 一 个 组 件 ， 标 签 。 


1#//usr/bin/env python 

2 

3 import Tkinter 

4 

5 top = Tkinter. Tk 

6label = Tkinter. Label (top, text= Hello World!’) 
7 label. pack () 

8 Tkinter. mainloop () 





19.3 Tkinter 举例 
19. 3. 1 标签 组 件 


在 例 19. 1 中 ， 我 们 展示 了 Tkinter Mif] “Hello World!” — tkhellol. py。 实 际 上 ， 它 利用 组 
件 向 您 展示 了 如 何 创 建 一 个 Tkinter 应 用 程序 。 











第 一 行 ， 我 们 先 创 建 了 一 个 顶层 窗口 。 随 后 是 写 着 那 串 举世 闻名 的 字符 的 标签 组 件 。 我 们 指明 
用 packer 来 管理 和 显示 组 件 ， 并 最 终 调用 mainloop 0 〇 来 运行 GUI 程序 。 图 19-1 展示 了 运行 该 GUI 
程序 后 ， 您 将 会 看 到 的 效果 。 
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19.3.2 按钮 组 件 


第 二 个 例子 和 第 一 个 很 相似 。 但 我 们 这 次 将 创建 一 个 按钮 而 不 只 是 显示 一 个 简单 的 文字 标签 。 
例 19.2 是 tkhello2. py 的 源码 。 


< 








NE A 
Hello World! 


Unix (twm) Windows 
19-1 Tkinter Label widget 
(tkhellol. py) 








例 19.2 ”按钮 组 件 演 示 〈tkhel11o2. py) 
本 例 和 tkhellol.py 完全 相同 ， 除 了 我 们 创建 的 是 按钮 组 件 而 非 标签 组 件 。 


1 #l/usr/bin/env python 

p 

3 import Tkinter 

4 
Stop = Tkinter. Tk Q 
6quit = Tkinter. Button(top, text= Hello World!’, 
7command=top. quit) 


8quit. pack O 
9Tkinter. mainloop 0 














前 面 几 行 是 相同 的 。 不 同 的 只 是 我 们 创建 的 是 按钮 组 件 。 我 们 的 按钮 有 一 个 额外 的 参数 ， 
Tkinter. quit (0 方 法。 这 将 给 我 们 的 按钮 安装 一 个 回调 函数 ， 在 按钮 按 下 《并 释放 ) 后 让 整个 程序 
退出 。 最 后 的 两 行 是 通常 的 pack() 和 进入 mainloop () 。 这 个 简单 的 按钮 应 用 程序 展示 在 图 19-2 中 。 





19. 3. 3 标签 和 按钮 组 件 


我 们 把 tkhellol. py 和 tkhello2.py 组 合 到 tkhello3. py 中 ， 得 到 一 个 同时 包含 标签 和 按钮 的 
脚本 。 另 外 ， 我 们 现在 还 使 用 了 更 多 的 参数 ， 而 不 再 满足 于 完全 使 用 那些 自动 添 入 的 缺 省 参数 。 例 


e 
* 








aa + 
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19. 3 给 出 了 tkhello3. py 的 源码 。 





除了 对 组 件 新 加 的 参数 ， 我 们 还 看 到 对 packer 的 一 些 参 数 。fill 参数 告诉 packer 让 QUIT 按钮 
填充 水 平方 向 的 剩余 空间 ， 而 expand 参数 则 引导 packer 填充 了 水 平方 向 的 所 有 可 视 空间 ， 并 拉 伸 
按钮 到 达 窗 口 的 左右 边界 。 





< 











Pa [s] tk 


Hello World! | 


Unix Windows 
19-2Tkinter Label widget (tkhellol. py) 





4 19. 3 标签 和 按钮 组 件 演示 (tkhello3. py) 
本 例 同 时 展示 了 标签 和 按钮 组 件 。 既 然 我 们 已 经 了 解 了 按钮 组 件 和 如 何 配置 它 ， 我 们 就 可 以 设 
置 的 更 多 一 些 ， 而 不 必 像 以 前 那样 大 都 使 用 缺 省 参数 。 


$ 1 #l/usr/bin/env python E 
2 


3 import Tkinter 
4top = Tkinter. Tk() 
5 
6hello = Tkinter. Label (top, text= Hello World!’ ) 
7hello. pack () 
8 
9quit = Tkinter. Button (top, text= QUIT’, 
10  command-top.quit, bg-'red', fg= white’) 
li  quit.pack(fill-Tkinter. X, expand-1) 
12 
13 Tkinter. mainloop Q 





? 
正如 您 在 图 19-3 中 看 到 的 ， 对 packer 没有 其 他 指令 时 ， 组 件 是 按 垂 直 顺 序 放置 的 〈 依 次 放 在 


其 他 组 件 的 上 面 )。 要 水 平 放置 则 需要 创建 一 个 框架 对 象 ， 再 用 它 来 添加 按钮 。 作 为 父 对 象 的 唯一 子 
对 象 ， 框 架 将 占据 父 对 象 的 空间 (参见 19. 3. 6 小 节 例 19. 6 中 listdir. py 模块 对 按钮 的 处 理 ) 。 


4 e 
aa +e 
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tk ME 






Hello World! 


QUIT 
Unix Windows 


19-3 Tkinter Label and Button 
widgets (tkhello3. py) 


QUIT 








19.3. 4 标签 、 按 钮 和 进度 条 组 件 





我 们 的 最 后 一 个 小 例子 tkhello4. py， 增 加 了 一 个 进度 条 组 件 。 有 具体 来 说 ， 这 个 进度 条 是 用 来 和 
标签 组 件 交 互 的 。 进 度 条 的 滑 块 被 用 作 控制 标签 组 件 文本 大 小 的 工具 。 滑 块 的 位 置 值 越 大 字体 就 越 
大 ， 反 之 亦 然 ， 越 小 的 位 置 值 意味 着 越 小 的 字体 。 例 19. 4 展示 了 tkhello4. py 的 源码 。 





例 19. 4. 标签 ， 按钮 和 进度 条 组 件 演示 (tkhello4. py) 


我 们 最 后 一 个 组 件 例 子 介绍 了 进度 条 组 件 ， 重 点 放 在 组 件 间 通过 回调 函数 的 交互 [诸如 
resize()]。 您 对 进度 条 组 件 的 动作 将 影响 标签 组 件 上 的 文字 。 


1 #!l/usr/bin/env python 

2 

3 from Tkinter import * 

4 

5 def resize (ev=None): 

6 label. config (font=’ Helvetica —%d bold’ % | 
7 scale. get ()) 

8 

9 top = Tk(Q 

10 top. geometry ( 250x150’) 

11 

12 label = Label (top, text= Hello World!’, 
13 font= Helvetica -12 bold’) 


IN 
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14 label. pack(fill-Y, expand=1) 





15 
16 scale = Scale(top, from =10, to=40, 
v7 oritent=HORIZONTAL, command=resize) 


18 scale. set (12) 
19 scale. pack (fill=X, expand=1) 


20 

21 quit = Button(top, text="QUIT’, 

22 command-top. quit, activeforeground- white’, 
23 activebackground= red’) 

24 quit. pack 0) 

25 


26 mainloop() 








这 段 脚 本 新 增加 的 resizing 0) 回调 函数 (5-7 fT) 附加 在 进度 条 组 件 上 。 这 段 代码 在 进度 条 的 
滑 块 被 移动 时 激活 ， 调 整 标签 里 文字 的 大 小 。 











我 们 还 限定 了 顶层 窗口 的 尺寸 (250X150) CH 10 行 )。 这 段 脚本 和 前 3 段 的 最 后 一 个 不 同 点 
是 用 “from Tkinter import *” #@ Tkinter 模块 的 属性 引入 我 们 的 名 字 空 间 。 虽 然 不 建议 这 样 做 ， 
因为 这 会 “污染 ”您 的 名 字 空 间 ， 但 这 个 程序 涉及 大 量 对 Tkinter 属性 的 引用 ， 这 正 是 我 们 这 样 做 
的 主要 原因 。 这 种 方式 〈 译 者 注 : 原文 这 里 表达 的 不 够 清晰 ， 本 意 是 指 import Tkinter 的 方式 ) 
要 求 访问 每 个 属性 时 都 使 用 它们 的 全 部 限定 性 名 称 。 而 通过 这 种 不 被 推荐 的 快捷 方式 ， 我 们 可 以 在 
访问 属性 时 减少 输入 并 且 让 代码 易于 理解 ， 但 同时 也 付出 了 一 些 代价 。 















































正如 您 在 图 19-4 所 看 到 的 ， 滑 块 装置 及 当前 位 置 值 都 显示 在 窗口 的 显著 位 置 。 图 19-4 展示 了 
用 户 把 进度 条 / 滑 块 移动 到 36 时 的 GUI 程序 状态 。 
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KE tk eee 


Hello World! 


QUIT . 
eu | Unix 


IN 
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19-4 Tkinter Label, Button, and Scale 
widgets (tkhello4. py) 





从 代码 中 可 以 看 出 ， 进 度 条 的 初始 值 在 程序 启动 时 被 设置 为 12 (第 18 行 )。 
19. 3. 5 偏 函数 应 用 举例 


在 看 更 大 的 GUI 程序 之 前 ， 我 们 先 回 顾 一 下 第 11 章 11. 7. 3 节 介 绍 的 偏 函数 应 用 (PFA)。 





Python2. 5 新 增 了 PFA 等 一 系列 新 特性 ， 它 们 显著 提高 了 Python 对 函数 编程 的 支持 。 


偏 函数 允许 您 “预存 ”一 些 函数 变量 并 有 效 的 “冻结 ”了 这 些 预 定 参 数 ， 在 运行 时 您 获得 了 所 
需 的 其 他 变量 后 再 把 它们 “解冻 ”出 来 ， 用 这 些 最 终 确定 的 参数 去 调用 函数 。 








最 妙 的 是 ，PFA 不 仅仅 局 限于 函数 。 它 们 对 任何 “可 调用 ”的 东西 都 有 效 ， 任 何 有 函数 接口 的 对 
象 ， 比 如 类 、 方 法 、 或 可 调用 对 象 ， 只 要 是 有 括号 的 。 对 于 有 许多 待 调 对 象 并 且 许 多 调用 都 反复 使 
用 相同 参数 的 情况 ， 用 PFA 是 最 合适 不 过 的 。 


GUI 编程 有 很 好 的 操作 环境 ， 因 为 很 有 可 能 您 需要 GUI 组 件 有 某 些 一 致 的 外 观 和 体验 ， 而 这 些 一 
致 性 表现 在 可 以 使 用 相同 的 参数 创建 相似 的 对 象 。 我 们 现在 要 展示 的 应 用 程序 中 ， 将 有 多 个 按钮 有 
着 相同 的 前 景色 和 背景 色 。 对 这 些 仅 有 细小 差别 的 按钮 ， 每 次 调 相同 的 构造 函数 作 初 始 化 时 都 输入 
些 相 同 的 参数 实在 是 一 种 浪费 : 前 景 和 背景 色 都 一 样 ， 只 是 文字 有 细小 差别 。 

















我 们 将 用 交通 指示 牌 作为 例子 ， 程 序 中 尝试 创造 一 种 文字 型 的 交通 指示 牌 ， 并 且 把 它们 分 成 如 
BILE: 和 危急 、 和 警告、 通知 〈 正 好 和 日 志 信息 级 别 相 )。 指 示 牌 的 类 型 决定 了 它们 在 创建 时 的 颜色 格 
局 。 例 如 ， 和 危急 指示 牌 使 用 亮 红 文字 和 白色 背景 ， 和 警告 指 示 牌 使 用 黑色 文字 和 金色 背景 ， 通 知 也 就 
是 普通 指示 牌 使 用 黑色 文字 和 和 白色 背景 。 我 们 约定 “Do Not Enter” 和 “Wrong Way” 标 识 为 危急 ， 
“Merging Traffic” # “Railroad Crossinig” 标 识 为 警告 , “Speed Limit" #l “One Way” 标 识 
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为 通知 。 该 程序 创造 “指示 牌 ” CMRR ESH. 当 用 户 点 下 按钮 时 ， 将 简单 的 弹出 一 个 Tk 响 




















应 对 话 框 ， 显 示 和 危急/ 错误 、 和 警告 、 通 知 。 这 的 确 不 够 好 玩 ， 但 如 何 创建 这 些 按钮 却 很 有 趣 。 您 将 在 
例 19.5 看 到 这 里 所 描述 的 程序 。 


< 














例 19.5 运用 PFA 的 路 灯 指 示 牌 GUI 程序 (pfaGUI2. py) 
按照 指示 类 型 创建 适当 前 景 、 背 景色 的 路 灯 指 示 牌 。 使 用 PFA 帮助 “模板 化 ”常用 GUI 参数 。 
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Z!/usr/bin/env python 


from functools import partial as pto 
from Tkinter import Tk, Button, X 


from tkMessageDox import showinfo, showwarning, showerror 
WARN = "warn! 
CRIT = crit’ 
REGU = ’ regu’ 


SIGNS = { 


“ao not enter’: CRIT, 
’railroad crossing’: WARN, 


’55\nspeed limit’: REGU, 
"wrong way’: CRIT, 
'merging traffic’: WARN, 
"one way’: REGU, 

i 


critCB = lambda: showerror( Error’, 'Error Button Pressed!’ ) 
warnCB = lambda: showwarning ( Warning’, 

’Warning Button Pressed!’ ) 

infoCB = lambda: showinfo( Info’, 'Info Button Pressed!’ ) 


p = TKO 
top. title( Road Signs’) 
Button (top, text= QUIT’, command=top. quit, 
bg-'red', fg- white’). pack 


MyButton = pto(Button, top) 
CritButton = pto(MyButton, command-critCB, bg= white’, fg-'red') 
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32 WarnButton = pto(MyButton, command-warnCB, bg-'goldenrodl') 
33 | ReguButton = pto(MyButton, command-infoCB, bg= white’) 

34 

35 for eachSign in SIGNS: 

36 signType = SIGNS[eachSign] 

37 cmd = ’%sButton(text=%r%s). pack(fill-X, expand-True)' % ( 
38  signlype.title(), eachSign, 

39  '.upper(" if signType == CRIT else '. title()’) 

40 eval (cmd) 

4] 

42 top. mainloop () 





QUIT : 
WRONG WAY | 
DO NOT ENTER | 





19 -5Road signs PFA GUI application on XDarwin in 
MacOS X (pfaGUI2. py) 





当 您 执行 这 个 程序 时 ， 会 看 到 一 个 类 似 图 19. 5 的 GUT. 
逐 行 注解 


1-18 行 
作为 开始 ， 我 们 导入 了 functional. partial()、 一 些 Tkinter 属性 以 及 Tk 对 话 框 (1-5 行 )。 
然后 ， 我 们 定义 了 一 些 标识 及 其 相应 类 型 。 


20-28 行 
Tk 对 话 框 被 关联 到 按钮 回调 函数 ， 我 们 将 在 创建 按钮 时 使 用 它们 (20-23 行 )。 然 后 加 载 Tk, w 
置 标题 ， 并 创建 了 一 个 QUIT 按钮 (25-28 行 )。 





30-33 行 


* 
aa +e 
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这 些 行 展示 了 PFA 的 魔力 。 我 们 通过 两 个 步骤 实现 PFA。 第 一 步 是 模板 化 的 按钮 类 及 根 窗口 top。 


这 样 当 每 次 我 们 调用 MyButton 时 ， 它 会 转 而 调用 Button (Tkinter. Button O 创建 了 一 个 按钮 ) 并 使 
用 top 作为 其 第 一 个 参数 。 我 们 把 这 一 切 “冻结 ”在 了 MyButton 里 。 














PFA 的 第 二 步 使 用 了 第 一 步 的 结果 --MyButton-- 并 再 次 对 它 模板 化 。 我 们 对 每 个 不 同 的 指示 类 型 
都 创建 了 单独 类 型 的 按钮 。 当 用 户 创建 个 危急 按钮 CritButton 时 (通过 调用 CritButton () )， 
会 转 而 调用 MyButton 并 使 用 恰当 的 按钮 回调 和 前 景 、 背 景色 参数 ， 这 意味 着 用 top、 按 钮 回调 、 
ee ee mue 
个 特性 ， 它 执行 的 那些 调用 本 该 由 您 自己 执行 。 我 们 把 同样 的 步 又 应 用 到 WarnButton 和 ReguButton 
上 。 














35-42 fT 

按钮 类 创建 过 程 结 束 后 ， 我 们 遍历 了 指示 列表 并 创建 出 指示 牌 。 我 们 使 用 了 一 个 Python 求 值 字 
串 ， 它 由 正确 的 按钮 名 字 、 作 为 按钮 标签 传 入 的 text 参数 组 成 ， 然 后 再 pack 0 一下。 如 果 这 是 个 危 
急 指示 牌 ， 我 们 就 把 按钮 文字 全 转 成 大 写 ， 否 则 的 话 就 以 标题 形式 显示 。 最 后 一 步 在 第 39 行 完成 ， 
同时 也 展示 了 Python2.5 引入 的 另 一 个 特性 ， 临 时 操作 符 。 随 后 我 们 对 每 一 个 按钮 创建 字 串 施 以 
eval ()， 每 次 创建 一 个 按钮 ， 最 终 形成 了 前 面 看 到 的 图 形 。 最 后 我 们 进入 主事 件 循环 ， 启 动 GUI. 
































个 应 用 程序 使 用 了 一 些 Python2. 5 的 新 特性 ， 所 以 您 不 能 在 旧版 上 运行 它 。 


19. 3. 6 中 级 Tkinter 范例 E 


我 们 以 一 个 比较 大 型 的 例子 来 总 结 本 节 ，1istdir. py. ASMA ET A a R.. 
它 从 当前 目录 开始 并 提供 文件 列表 功能 。 双 击 列表 中 的 任意 其 他 目录 都 会 让 该 工具 转向 这 个 新 的 目 
录 ， 同 时 用 新 目录 中 的 文件 列表 普 换 原 有 的 文件 列表 。 源 码 作为 例 19. 6 给 出 。 



































< 
例 19.6 GUI 文件 遍历 系统 (listdir. py) 








这 个 稍 高 级 一 些 的 GUI 程序 扩大 了 组 建 的 使 用 范围 ， 演 员 名 单 里 新 增 了 列表 框 、 文 本 框 、 和 滚 
动 条 。 而 且 还 有 大 量 的 回调 函数 ， 例 如 鼠标 点 击 、 键 盘 和 输入、 和 滚动 条 操作 。 








Ig!/usr/bin/env python 
2 

3import os 

4from time import sleep 
from Tkinter import * 
6 

7class DirList (object): 
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9 def init (self, initdir=None): 








self. top = TkQ 
self. label = Label (self. top, 

text= Directory Lister vl. 1’) 
self. label. pack () 


self. cwd = StringVar (self. top) 


self. dirl = Label (self. top, fg= blue’, 
font=( Helvetica’, 12, 'bold')) 
self. dirl. pack O 


self. dirfm = Frame (self. top) 
self. dirsb = Scrollbar (self. dirfm) 
self. dirsb. pack (side-RIGHT, fill-Y) 
self. dirs = Listbox (self. dirfm height=15, 
width=50, yscrollcommand=self. dirsb. set) 
self. dirs. bind( Double-L>’, self. setDirAndGo) 
self. dirsb. contig (command=self. dirs. yview) 
self. dirs. pack (side=LEFT, fi11=BOTH) 
self. dirfm. pack () 


self. dirn = Entry (self. top, width=50, 
textvariable=self. cwd) 

self. dirn. bind( <Returm’, self. doLS) 
self. dirn. pack () 


self. bfm = Frame (self. top) 

self. clr = Button (self. bfm text= Clear’, 
command-self. clrDir, 
activeforeground= white’, 
activebackground= blue’ ) 

self. ls = Button (self. bfm, 
text= List Directory’, 
command-self. doLS, 
activeforeground= white’, 
activebackground= green’ ) 

self. quit = Button (self. bfm, text= Quit’, 
command-self. top. quit, 
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48 activeforeground= white’, 
49 activebackground= red’) 
50 self. clr. pack (side=LEFT) 
5l self. ls. pack (side-LEFT) 
52 self. quit. pack (side-LEFT) 
ad self. bfm. pack O 
54 
55 If initdir: 
56 self. cwd. set (os. curdir) 
57 self. doLS () 
58 
59 def clrDir (self, ev=None): 
60 self. cwd. set C’) 
61 
62 def setDirAndGo (self, ev-None): 
63 self. last = self. cwd. get Ọ 
64 self. dirs. config (selecthackground= red’) 
65 check = self. dirs. get (self. dirs. curselection )) 
66 if not check: 
67 check - os.curdir 
68 self. cwd. set (check) 
69 self. doLS () 
70 
77 def doLS(self, ev-None): 
72 error = ”” 
73 tdir = self. cwd. get () 
74 if not tdir: tdir = os. curdir 
75 
76 if not os. path. exists (tdir): 
77 error = tdir + °: no such file’ 
78 elif not os. path. isdir (tdir): 
79 error = tdir + ': not a directory’ 
80 
8&1 If error: 
82 self. cwd. set (error) 
83 self. top. update () 
84 sleep (2) 
85 if not (hasattr(self, 'last') | 
86 and self. last): 
87 self. last = os. curdir 
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88 self. cwd. set (self. last) 

89 self. dirs. config (| 

90 selectbackground-'LightSkyBlue') 

91 self. top. update () 

92 return 

93 

94 self. cud. set (| 

95 ” FETCHING DIRECTORY CONTENTS. .. ") 

96 self. top. update () 

97 dirlist = os. listdir (tdir) 

98 dirlist. sort () 

99 os. chdir (tdir) 

100 self. dirl. config(text-os. getcwd ()) 

101 self. dirs.delete(0, END) 

102 self. dirs. insert (END, os. curdir) 

103 self. dirs. insert (END, os. pardir) 

104 for eachFile in dirlist: 

105 self. dirs. insert (END, eachFile) 
106 self. cwd. set (os. curdir) 
107 self. dirs. config (| 
108 selectbackground-'LightSkyBlue') 
109 


110 def main: 
111 d = Dirlist (os. curdir) 
112 mainloop 0 





113 
114 if name  -- ' main 
115 main(Q 
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19-6List directory GUI application in Windows (listdir. py) 





indows 





在 图 19-6 中 ， 我 们 展示 了 Windows 环境 中 的 GUI 外 观 。 
这 个 程序 的 Unix 版 本 在 图 19-7 中 展示 。 
逐 行 注解 
1-5 行 
开始 的 几 行 包括 通常 的 Unix 启动 行 和 导入 os 模块 、time. sleep 函数 、 及 Tkinter 模块 的 所 有 
属性 。 
9-13 行 


这 些 行 定义 了 DirList 类 的 构造 函数 ， 以 及 一 个 代表 我 们 程序 的 对 象 。 我 们 创建 的 第 一 个 标签 
包含 了 应 用 程序 的 主 标题 和 它 的 版 本 号 。 
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Directory Lister v1.1 


Amp 





Gear | List Directory | Quit | Unix 


19-7 List directory GUI application in Unix 
(listdir. py) 
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15-19 47 
我 们 声明 了 一 个 名 为 cwd 的 Tk 变量 来 保存 当前 所 在 目录 的 名 字 -- 我 们 马上 就 会 看 到 这 个 值 从 哪 
来 。 还 创建 了 另 一 个 标签 来 显示 当前 目录 的 名 字 。 














21-29 行 

这 段 代 码 定义 了 我 们 这 个 GUI 程序 的 核心 ，dirs (FIRE) 包含 了 被 列 目录 的 文件 列表 。 使 用 
一 个 滚动 条 以 便 用 户 在 文件 数目 超过 列表 框 窗 口 尺 寸 时 移动 列表 。 这 两 个 组 件 都 被 包含 在 一 个 框架 
组 件 中 。 列 表 框 用 bind O 方 法 把 回调 函数 CsetDirAndGoO 和 列表 项 绑 定 起 来 。 














绑 定 意味 着 把 一 个 回调 函数 连接 在 键盘 输入 、 鼠 标 动 作 、 或 其 他 什么 事件 上 ， 当 这 个 事件 被 用 
户 触 发 时 就 会 执行 这 个 回调 函数 。 当 列表 框 中 的 任 一 项 被 双击 时 setDirAndGo () 函数 就 会 被 调用 。 滚 
动 条 被 Scrollbar. config () 方 法 贴 附 在 列表 框 上 。 





31-34 行 

随后 我 们 创建 了 一 个 文本 框 让 用 户 输入 目录 名 ， 以 便 转 到 他 /她 想 去 的 目录 ， 并 在 列表 框 中 显示 
该 目录 中 的 文件 。 我 们 为 该 文字 输入 区 加 入 了 一 个 RETURN 或 Enter 键 的 绑 定 ， 这 样 用 户 就 能 用 裔 
RETURN 的 方法 代 丛 按钮 点 击 ， 同 样 的 事 也 会 发 生 在 上 面 提 到 的 列表 框 中 。 当 用 户 双击 列表 项 时 ， 效 
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果 等 同 于 用 户 在 文本 框 中 输入 目录 名 然后 点 击 “go” 按 钮 。 


36-53 47 
接 下 来 我 们 定义 了 一 个 按钮 框架 (bfm) mE 个 按钮 : 一 个 “clear” 按 钮 (clr)， 一 个 
“go” 按 钮 Cs), M—A “quit” ë (quite)。 每 一 个 按钮 都 有 各 自 不 同 的 配置 和 点 击 时 的 回调 

















55-57 行 
构造 函数 的 最 后 一 部 分 初始 化 了 这 个 GUI 程序 ， 程 序 将 从 当前 工作 目录 开始 。 





59-60 行 

Qo Lac n erae d ai Mn RA CM i: 这 个 变量 用 来 跟踪 我 
们 当前 所 处 的 目录 ， 更 重要 的 是 ， 在 错误 发 生 时 协助 返回 上 一 个 目录 。 您 一 定 注意 到 了 回调 函数 中 
的 ev 参数 的 缺 省 值 是 None。 这 样 的 任意 值 都 可 能 由 窗口 系统 传 回 ， 它 们 在 您 的 回调 函数 里 可 以 用 也 















































可 以 不 用 。 

62-69 行 

setDirAndGo () 方 法 设置 了 要 到 达 的 目录 并 产生 一 个 对 doLS 0 〇 方法 的 调用 , 后 者 负责 实现 其 余 的 
一 切 。 


71-108 行 
* 现在 看 来 ，doLS O 是 整个 GUI 程序 的 关键 。 它 负责 所 有 的 安全 性 检查 (目标 是 否 是 一 个 目录 以 
及 它 是 否 存 在 ? ) 如 果 有 错误 发 生 ， 最 终 目录 会 被 设置 为 当前 目录 。 如 果 一 切 正确 ， 它 调用 
ss 当 后 台 忙 于 获取 新 目录 信息 时 ， 高 亮 的 
蓝 色 条 会 变 成 亮 红色 。 当 新 目录 设置 完毕 ， 它 会 恢复 蓝 色 









































110-115 fr 
listdir. py 中 的 最 后 一 段 代 码 明 显 是 代码 的 主体 。main O 函数 只 有 在 该 脚本 被 直接 调用 时 才 会 
执行 ， 并 且 当 它 执 行 时 会 创建 GUI 程序 ， 后 者 随 之 掌控 该 程序 。 








我 们 把 该 程序 的 所 有 其 他 方面 都 留 给 读者 作为 练习 ， 再 次 提醒 您 ， 把 整个 程序 看 成 是 一 系列 组 
件 和 功能 的 组 合 ， 一 切 就 都 会 简单 起 来 。 如 果 您 清楚 的 知道 每 个 单独 程序 段 的 意思 ， 那 么 整个 脚本 
就 不 会 再 显得 可 怕 了 。 








但 愿 我 们 给 了 您 一 个 够 好 的 关于 Python 和 Tkinter 的 GUI 编程 介绍 。 请 记 住 熟悉 Tkinter 编程 
最 好 的 方法 就 是 实践 和 模仿 一 些 例子 ! Python 发 行 包 附 带 了 很 多 可 供 您 学 习 的 应 用 程序 范例 。 

















如 果 您 下 载 了 源码 包 ， 就 会 在 Lib/lib-tk、Lib/idlelip、 和 Demo/tkinter 下 发 现 Tkinter 的 
演示 人 代码。 如果 您 把 Win32 版 本 的 Python 安装 在 C:\Python2.x， 那 么 可 以 在 Lib\lib-tk 和 
Lib\idlelib 下 找到 这 些 演示 代码 。 最 后 那个 目录 包含 了 最 出 名 的 Tkinter 例子 程序 : IDLE 
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IDE 本 身 。 还 有 一 些 关 于 Tk 编程 的 书籍 供 进一步 参考 ， 其 中 一 本 是 专 为 Tkinter 编写 的 。 


19.4 其 他 GUI 简介 








我 们 期 望 最 终 能 编写 出 独立 的 一 章 来 对 GUI 编程 作 总 体 介 绍 ，Python 拥有 的 大 量 图 形 工具 集中 
有 很 多 内 容 值得 一 讲 ， 然 而 ， 这 只 能 是 以 后 的 事 了 。 作 为 蔡 代 ， 我 们 将 使 用 其 中 4 种 比较 流行 且 可 








用 的 工具 集 来 编写 同一 个 GUI 程序 示例 : Tix (Tk Interface eXtensions)、Pmw (Python MegaWidget 


S 


的 Tkinter 扩展 )、wxPython (wxWidgets 的 Python 绑 定 )、 和 PyGTK (GTK+ 的 Python 绑 定 )。 您 可 





以 在 本 章 末 尾 参考 部 分 获取 更 多 信息 和 下 载 这 些 工具 集 的 地 方 。 


Tix 模块 包含 在 Python 标准 库 中 ， 己 经 可 用 了 。 其 他 工具 集 是 第 三 方 的 ， 你 必须 自己 下 载 。 








为 Pmw 只 是 对 Tkinter 的 一 个 扩展 , 它 的 安装 是 最 简便 的 (只 需 解压 到 您 的 网 络 包 目 录 下 )。wxPytho 


n 


和 PyGTK 涉及 下 载 多 个 文件 并 编译 《除非 您 使 用 的 是 Win32 版 本 ， 这 样 的 话 通常 有 安装 包 可 用 )。 一 





且 这 些 工具 集 安装 好 并 通过 证 ， 我 们 就 能 开始 了 。 我 们 不 打算 局 限 在 本 章 已 经 讲 过 的 那些 组 件 上 ， 
我 们 准备 在 后 面 的 例子 中 介绍 一 些 更 复杂 的 组 件 。 





除 过 我 们 已 经 看 到 过 的 标签 和 按钮 组 件 ， 我 们 准备 介绍 控制 按钮 (Control， 又 叫 微调 按钮 ， 


SpinButton) 和 组 合 框 组 件 〈ComboBox )。 控 制 组 件 是 一 个 文本 组 件 和 一 对 箭头 按钮 的 组 合 ， 文 本 
值 受 旁边 按钮 的 “控制 ”或 者 说 “ 旋 上 、 旋 下 ”， 而 组 合 框 则 通常 包括 一 个 文本 组 件 和 一 个 下 拉 衣 





单 ， 染 单项 列表 中 当前 激活 或 选中 的 项 目 将 显示 在 文本 组 件 中 。 





我 们 的 应 用 程序 相当 简单 : 成 对 的 动物 要 被 搬 走 , 动物 的 总 数 在 从 一 对 到 一 打 ( 译 者 注 : 12 只 ) 


的 范围 内 。 用 控制 组 件 来 显示 总 数 ， 用 组 合 框 显示 动物 种 类 列表 菜 蛙 供用 户 选 择 。 注 意 默 认 的 动物 


数量 是 2， 且 没有 选择 动物 类 型 。 


一 旦 我 们 开始 执行 这 个 程序 ， 事 物 就 变 得 不 同 了 ， 图 19-9 就 是 例证 ， 它 显示 的 是 在 Tix 程序 中 





~ 





改变 一 些 元 素 后 的 结果 。 


下 面 ， 您 将 看 到 所 有 4 个 版 本 的 GUI 程序 代码 。 您 会 发 现 尽管 它们 有 些 相似 ， 但 每 一 个 都 有 自 





己 的 特别 之 处 。 而 且 我 们 使 用 . pyw 作为 文件 后 级 ， 这 样 可 以 防止 弹出 Dos 命令 窗口 或 终端 窗口 。 





< 
tix | [Gi] x| [3] gtk +.py -ioj xj 
Animals (in pairs; min: pair, max: dozen) Animals (in pairs; min: i 
Number: 4 Number: 


Type: | 
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| wxWidgets of x] 


Animals (in pairs; min: pair, max: dozen) 
tk 二 | 口 | x|| Number: 


Animals [in pairs; min: pair, max: dozen] | 2 m 


Number: m^ Type: 
Type] x| | zl 


Pmw wxPython 








19-8 Application using various GUIs under Win32 (animal*. pyw) 


tix .- lol xj 
Animals (in pairs; min: pair, max: dozen) 
Number: 
Type: [python 









Tix 
19-9 After modifying the Tix GUI version of our application (animalTix. pyw) 
? 





19.4.1 Tk Interface eXtensions (Tix) 


我 们 从 一 个 使 用 Tix 模块 的 例子 (19.7) 开始 。Tix 是 对 Td/T〈 译 者 注 : 应 该 是 Tc1/Tk) 的 一 
个 扩展 库 ， 其 中 增加 了 许多 新 的 组 件 、 图 像 类 型 和 其 它 一 些 命令 ， 提 高 Tk 作为 GUI 开发 工具 集 的 可 
用 性 。 我 们 现在 来 看 看 如 何在 Python 中 使 用 Tix. 











< 





Tix GUI 编程 演示 (animalTix. pyw) 
我 们 的 第 一 个 例子 使 用 Tix 模块。Tix 已 经 是 Python 的 一 部 分 了 ! 


1 
2 
3 
4 
3 
6 
7 
8 
又 


#!//usr/bin/env python 


from Tkinter import Label, Button, END 
from Tix import Tk, Control, ComboBox 


top = TO 
top. tk. eval ( package require Tix’) 


Ib = Label (top, 
text= Animals (in pairs; min: pair, max: dozen) ) 





aa + 
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e: 
li Ib. pack(Q) 
12 
13 ct = Control(top, label=’Number:’, 
14 integer=True, max-12, min=2, value=2, step=2) 
15 ct. label. config (font= Helvetica -14 bold’) 
16 ct. pack 
17 
18 | cb = ComboBox (top, label-'Type:', editable=True) 
19 for animal in (dog’, ‘cat’, 'hamster', 'python ): 
20  cb.insert(END, animal) 
21 cb. pack 
22 
23 qb = Button(top, text= QUIT’, 
24  command=top. quit, bg-'red', fg- white’) 
25 qb. pack () 
26 
27  top.mainloop () 








BAT TER 
1-7 行 
这 里 都 是 些 初始 化 代码 ， 模 块 导 入 操作 ， 以 及 基本 的 GUI 操作 。 第 7 行 的 断言 要 求 程序 可 以 使 
FA Tix 模块 。 








8-27 行 

这 些 行 创建 了 所 有 的 组 件 : 标签 〈9-11 行 )、 控 制 (13-16 行 )、 组 合 框 (18-21 行 )、 以 及 退出 
按钮 (23-25 行 )。 组 件 构造 函数 里 的 参数 都 很 浅显 明了 无 需 更 多 解释 。 最 后 ， 我 们 在 第 27 行进 入 
GUI 主事 件 循环 。 








19.4.2 Python MegaWidgets (PMW) 


下 面 通过 例 19. 8 让 我 们 来 看 看 Python MegaWidgets。 这 个 模块 体现 了 Tkinter 悠久 的 历史 。 它 
基本 上 是 通过 在 GUI 工具 集中 添加 一 些 新 式 的 组 件 来 延长 Tkinter 的 寿命 。 


这 个 Pow 的 例子 和 上 面 Tix 的 例子 是 如 此 的 相似 ， 以 致 我 们 不 准备 对 读者 逐 行 注解 它 。 代 码 中 
区 别 最 大 的 一 行 是 控制 组 件 的 构造 函数 ， 那 个 Pmw 的 控制 组 件 。 它 提供 了 验证 函数 的 入 口 。 不 同 于 
直接 在 组 件 构造 函数 中 以 关键 字 参 数 的 形式 传 入 最 大 、 最 小 值 ，Pmw 使 用 “验证 器 ”来 确保 值 不 会 超 
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出 我 们 可 接受 的 范围 。 











现在 我 们 终于 要 离开 Tk 的 世界 了 。Tix 和 Pmw 分 别 扩展 了 Tk 和 Tkinter， 然 而 我 们 现在 将 改变 
方向 去 看 看 完全 不 同 的 工具 集 ，wxWidgets 和 GTK+。 在 使 用 这 些 现代 的 、 健 壮 的 GUI 工具 集 时 ， 您 
将 发 现代 码 的 行 数 增加 了 ， 这 是 因为 我 们 使 用 了 更 多 的 面向 对 象 特 性 。 








19.4.3 wxWidgets 和 wxPython 





wxWidgets〔 以 前 称 作 wxWindows) 是 一 个 跨 平 台 的 工具 集 ， 用 来 构建 图 像 用 户 程序 。 它 用 Ce 
实现 并 在 各 种 平台 上 广泛 使 用 ，wxWidgets 为 这 些 平 台 定义 了 一 致 、 通 用 的 API. wxWidgets 最 大 的 
优点 它 在 每 个 平台 上 都 使 用 原生 GUI, 所 以 您 的 程序 将 和 所 有 其 它 桌 面 程序 有 相同 的 外 观 和 用 户 体验 。 
另 一 个 特点 是 您 不 会 被 局 限于 使 用 C++ 开发 wxWidgets 应 用 程序 。 它 有 对 Python 和 Perl 的 接口 。 例 
19. 9 使 用 wxPython 展示 了 我 们 那个 动物 应 用 程序 。 























《 
Pmw GUI 程序 演示 (animalPmw. pyw) 
我 们 的 第 二 个 例子 使 用 Python MegaWidgets 包 。 





1 "l/usr/bin/env python 


3 from Tkinter import Button, END, Label, W 


4 from Pmw import initialise, ComboBox, Counter 

5 

6 top - initialise() 

7 

8 Ib = Label (top, 

9 text= Animals (in pairs; min: pair, max: dozen) ) 
10  Ib.pack 

11 

12 ct = Counter (top, labelpos-W, label text=’Number:’, 
13 datatype= integer’, entryfield value=2, 
14 increment-2, entryfield validate=ť validator’: 
15 'integer', “min’: 2, "max : 12}) 

16 ct. packQ 

17 


18 cb = ComboBox (top, labelpos-W, label text-' Type: ') 
19 for animal in (dog’, ‘cat’, 'hamster', 'python ): 
20  cb.insert(end, animal) 


21 cb. pack 
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23 qb = Button(top, text= QUIT’, 
24  command=top. quit, bg-'red', fg- white’) 
25 qb. pack 


27 top. mainloop () 





J 注解 


5-37 ff 

这 里 我 们 先 编写 了 一 个 框架 类 (5-8 行 )， 它 的 唯一 成 员 即 其 构造 函数 。 这 个 方法 的 唯一 实用 目 
的 就 是 创建 我 们 的 组 件 。 在 框架 组 件 中 , 我 们 创建 了 一 个 画板 组 件 (panel)。 在 画板 中 我 们 用 BoxSizer 
来 包含 所 有 其 他 组 件 并 对 其 布局 〈 第 10、36 行 )， 这 些 组 件 是 标签 (12-14 行 )、 微 调 按钮 (16-20 
行 )、 列 表 框 (22-27 行 ) 和 退出 按钮 (29-34 行 )。 














< 

wxPython GUI 程序 演示 CanimalWx. pyw) 

我 们 的 第 三 个 例子 使 用 wxPython (以 及 wxWidgets)。 注 意 我 们 把 所 有 的 组 件 都 放 在 一 个 布局 
管理 器 里 ， 以 及 该 程序 中 更 多 的 面向 对 象 本 质 。 

















1 #!/usr/bin/env python 
2 
Simport wx 
4 
5class MyFrame (wx. Frame): 
6 def init (self, parent=None, id=-l, title-''): 


7 wx. Frame. init (self, parent, id, title, 

8 size=(200, 140)) 

9 top = wx. Panel (self) 

10 sizer - wx. BoxSizer (wx. VERTICAL) 

77 font = wx. Font (9, wx. SWISS, wx. NORMAL, wx. BOLD) 
IZ Ib = wx. StaticText (top, -1, 

13 "Animals (in pairs; min: pair, max: dozen)’) 
14 sizer. Add (Ib) 

15 


cl = wx. StaticText (top, -1, 'Number:') 

cl. SetFont (font) 

ct = wx. SpinCtrl(top, -1, °2’, min=2, max=12) 
sizer. Add (c1) 
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20 sizer. Add (ct) 
21 
22 c2 = wx. StaticText(top, -1, 'Type:') 
23 c2. SetFont (font) 
24 cb = wx. ComboBox (top, -1, '', 
25 choices=( dog’, cat’, 'hamster', 'python')) 
26 sizer. Add (cZ) 
27 sizer. Add (cb) 
28 
29 qb = wx. Button (top, -L QUIT”) 
30 qb. SetBackgroundColour ( red’) 
od qb. SetForegroundColour ( white’) 
32 self. Bind (wx. EVT. BUTTON, 
33 lambda e: self. Close (True), qb) 
34 sizer. Add (qb) 
35 
36 top. SetSizer (sizer) 
37 self. Layout () 
38 
39 class MyApp (wx. App): 
40 def OnInit (self): 
4] frame = MyFrame(title-^wxWidgets^) 
42 frame. Show (True) 
43 self. Set TopWindow (frame) 
44 return True 
45 
46 def main(): 
47 app = MyApp Ô 
48 app. MainLoop () 
49 
50 if name ==’ main 
al main () 





我 们 不 得 不 手工 为 微调 按钮 和 组 合 框 组 件 添 加 标签 ， 因 为 它们 看 起 来 并 不 包含 标签 。 一 旦 我 们 
创建 好 这 些 ， 就 把 他 们 加 到 布局 管理 器 中 ， 再 把 布局 管理 器 交 给 画板 组 件 ， 并 确定 其 中 每 个 组 件 的 
布局 。 您 会 注意 到 第 10 行 说 布局 管理 器 是 垂直 走向 的 ， 这 表明 我 们 所 有 的 组 件 都 会 按 从 上 到 下 的 顺 
序 排 列 。 



























































微调 按钮 组 件 有 一 个 弱点 ， 它 不 文 持 “ 步 进 ” 功 能 。 在 其 他 3 个 例子 中 ， 我 们 可 以 点 箭头 按钮 





$— 一 * 一 
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让 控制 组 件 每 次 增加 或 减少 2， 但 对 这 个 组 件 却 不 行 。 











39-51 行 
我 们 的 应 用 程序 类 实例 化 了 一 个 刚才 设计 的 框架 对 象 ， 把 它 绘制 在 屏幕 上 ， 并 设置 成 程序 的 顶 
层 窗口 。 最 后 ， 几 行 安 装 代 码 实例 化 了 GUI 应 用 程序 对 象 并 启动 之 。 








19. 4. 4 GTK* 和 PyGTK 





最 后 是 PyGTK 版 的 例子 ， 它 和 wxPython GUI 程序 非常 相似 《〈 见 例 19. 10)。 最 大 的 不 同 是 我 们 只 
用 一 个 类 ， 还 有 那些 设置 对 象 -- 实 际 上 就 是 按钮 -- 前 景 、 背 景色 的 代码 实在 是 很 元 长 。 




















逐 行 注解 


1-6 行 
我 们 导入 了 3 个 不 同 的 模块 和 包 , PyGTK, GTK 和 Pango. Pango 是 一 个 用 来 布局 和 生成 文本 的 库 ， 
专用 于 实现 II18N。 这 里 需要 这 个 库 是 因为 它 体现 了 GTK* (2. x) 对 文字 和 字体 处 理 的 核心 思想 。 


























《 
PyGTK GUI 程序 演示 (animalGtk. pyw) 





我 们 最 后 一 个 例子 使 用 PyGTK (和 GTK+)。 类 似 wxPython 的 例子 ， 这 里 对 应 用 程序 也 用 了 一 个 
类 。 对 比 一 下 这 两 个 GUI 程序 例子 的 相似 和 不 同 点 是 很 有 趣 的 。 这 种 现象 并 不 奇怪 ， 它 使 得 开发 者 
可 以 比较 容易 的 转 用 其 他 工具 集 。 








Ig!/usr/bin/env python 

2 

Simport pygtk 

4pygtk. require 2. 0’) 

5 import gtk 

6 import pango 

7 

8class GTKapp (object): 

9 def init (self): 


10 top = gtk. Window (gtk. WINDOW TOPLEVEL) 

2 top. connect (delete event’, gtk. main quit) 

12 top. connect ((destroy/, gtk. main quit) 

13 box = gtk. VBox (False, 0) 

14 Ib = gtk. Label ( 

15 "Animals (in pairs; min: pair, max: dozen)’) 
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16 box. pack start (1b) 
17 
18 sb = gtk. HBox (False, 0) 
19 adj = gtk. Adjustment (2, 2, 12, 2, 4, 0) 
20 sl = gtk. Label Č Number:’) 
21 sl. modify font ( 
22 pango. FontDescription( Arial Bold 107)) 
23 sb. pack start (sl) 
24 ct = gtk. SpinButton(adj, 0, 0) 
25 sb. pack start (ct) 
26 
27 
28 ch = gtk. HBox (False, 0) 
29 c2 = gtk. Label ( Type:’) 
30 cb. pack_start (c2) 
31 ce = gtk. combo box entry new text () 
32 for animal in (dog, 'cat', hamster’, 'python'): 
do ce. append text (animal) 
34 cb. pack start (ce) 
35 box. pack start (cb) 
36 
37 qb = gtk. Button( ^) 
38 red = gtk. gdk. color parse( red’) 
39 sty = qb.get style 0 
40 for st in (gtk. STATE NORMAL, 
41 gtk. STATE_PRELIGHT, gtk. STATE ACTIVE) : 
42 sty. bg[st/ = red 
43 gb. set_style(sty) 
44 ql = qb. child 
45 ql. set_markup (<span color-^white >QUIT</spam’) 
46 qb. connect object (clicked, 
47 etk. Widget. destroy, top) 
48 box. pack start (qb) 
49 top. add (box) 
50 top. show all () 
51 
52 if name  -- ' main 
53 animal = GTIKapp Q 
54 gtk. main Q 
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8-15 fT 

GTKapp 类 反应 了 本 程序 中 所 有 的 组 件 。 顶 层 窗口 在 这 里 创建 《窗口 管理 器 负责 关闭 它 )， 而 且 还 
创建 了 一 个 垂直 走向 的 布局 管理 器 (VBox) 来 掌管 我 们 的 主要 组 件 , 这 些 实际 上 和 我 们 在 wxPython GUI 
程序 中 作 的 一 样 。 


















































然而 ， 为 了 让 微调 按钮 和 组 合 框 的 静态 文本 能 出 现 它 们 的 左 侧 (wxPython 例子 中 出 现在 上 方 )， 
我 们 创建 了 小 型 的 水 平 走向 的 方 框 来 包括 标签 组 件 对 (18-36 行 ), 而 且 还 把 这 些 HBox 完全 置 于 VBox 
的 掌控 之 下 。 











接 下 来 我 们 创建 了 退出 按钮 并 把 VBox 添加 到 顶层 窗口 中 ， 然 后 把 一 切 绘制 到 屏幕 上 。 您 一 定 注 
意 到 我 们 刚 开 始 用 空 标题 创建 了 按钮 。 我 们 这 样 做 是 为 了 让 标签 〈 子 ) 对 象 能 作为 按钮 的 一 部 分 被 
创建 。 在 45-46 行 ， 我 们 取得 标签 的 访问 权 并 用 白色 字体 设置 了 文字 。 

















我 们 这 样 做 的 原因 是 如 果 您 直接 设置 前 景 风 格 -- 通 过 41-44 行 的 循环 和 辅助 代码 -那么 前 景 只 
会 对 按钮 起 作用 而 对 其 它 一 例如 标签 一 却 是 无 效 的 , 假如 您 把 前 景 设 为 白色 并 把 焦点 置 在 按钮 上 ( 通 
过 按 TAB 键 可 以 “选中 ” 它 )， 您 将 看 到 用 来 标识 选中 组 件 的 内 点 画 线 是 白色 的 ， 而 标签 文字 却 依然 
是 黑色 的 ， 除 非 您 像 我 们 在 第 45 行 那 样 改 一 下 。 


53-55 行 
我 们 在 这 里 创建 了 应 用 程序 并 进入 主事 件 循环 。 


19. 5. 相关 模块 和 其 他 GUI 














Python 还 有 一 些 其 他 的 GUI 开发 系统 。 我 们 在 表 19. 2 中 列 出 适当 的 模块 及 其 对 应 的 窗口 系统 。 





K 19. 2 Python 可 用 的 GUI 系统 





GUI 模块 或 系统 描述 

Tk 相关 模块 

Tkinter TK INTERface: Python 的 默认 GUI 工具 集 
http://wiki. python. org/moin/TkInter 

Pmw Python MegaWidgets (Tkinter 扩展 ) 
http: //pmw. sf. net 

Tix Tk Interface eXtension (Tk 扩展 ) 
http://tix.sf.net 

TkZinc (Zinc) Extended Tk canvas type (Tk 扩展 ) 


http://www. tkzinc. org 
EasyGUI (easygui) ”非常 简单 的 非 事件 驱动 GUIT (Tkinter 扩展 ) 
http://ferg. org/easygui 
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TIDE + (IDE Studio) Tix 集成 开发 环境 (包括 IDE Studio， 一 个 Tix 加 强 版 的 标准 IDLE IDE) 
http://starship. python. net/crew/mike 

















wxWidgets 相关 模块 

wxPython Python Xf wxWidgets 的 绑 定 , 一 个 跨 平 台 的 GUI 框架 库 ( 早 期 称 为 wxWindows ) 
http://wxpython. org 

Boa Constructor Python 集成 开发 环境 兼 wxPython GUI 构造 工具 
http://boa-constructor. sf. net 

PythonCard 基于 wxPython 的 GUI 桌面 应 用 程序 工具 集 CM HyperCard 获得 灵感 ) 
http://pythoncard. sf. net 

wxGlade 另 一 个 wxPython GUI 设计 工具 (M Glade (GTK+/GNOME 的 GUI 构建 





TA) 受到 启发 ) http://wxglade. sf. net 


表 19.2 Python 可 用 的 GUI 系统 CD 

















GUI 模块 或 系统 描述 

GTK+/GNOME 相关 模块 
PyGTK Python 对 GIMP 工具 集 (GTK+) 的 封装 库 http://pygtk. org 
GNOME-Python Python 对 GNOME 桌面 开发 库 的 绑 定 





http://gnome. org/start/unstable/bindings 
http://download. gnome. org/sources/gnome-python 














Glade 一 个 针对 GTK+ 和 GNOME 的 GUI 构建 工具 
http://glade. gnome. org 
PyGUI (GUI) “Pythonic” 式 的 跨 平 台 GUI 程序 编程 接口 (MacOS X 中 基于 Cocoa, 
POSIX/X11 和 Win32 中 基 Es GTK+ ) 
http://www. cosc. canterbury. ac. nz/ greg/python_gui 
Qt/KDE 相关 模块 
PyQt Trolltech 开发 的 Python 对 Qt GUI/XML/SQL 工具 集 的 绑 定 ( 双 协 议 ， 部 
分 开源 ) http://riverbankcomput ing. co. uk/pyat 
PyKDE Python 对 KDE 桌面 环境 的 绑 定 
http://riverbankcomputing. co. uk/pykde 
eric Python 使 用 QScintilla editor 组 件 编写 的 PyQt 集成 开发 环境 


http://die-offenbachs. de/detlev/eric3 
http: //ericide. python-hosting. com/ 

PyQtGPL 包括 Qt (Win32 Cygwin f£ TRO. Sip. QScintilla 和 PyQt 的 工具 包 
http://pythonqt. vanrietpaap. nl 


其 他 开源 GUI 工具 集 
FXPy Python 对 FOX TANABE Chttp://fox-toolkit. org) 
http://fxpy. sf. net 
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pyFLTK (fltk) Python 对 FLTK 工具 集 的 绑 定 “Chttp://fltk. org) 
http://pyfltk. sf. net 
PyOpenGL (OpenGL) Python 对 OpenGL 的 绑 定 (http://opengl. org) 


http: //pyopengl. sf. net 


表 19. 2 Python 可 用 的 GUI AB CD 





GUI 模块 或 系统 描述 

商业 软件 

win32ui Python 版 的 Microsoft MFC (基于 Python 的 Windows 扩展 ) 
http://starship. python. net/crew/mhammond/win32 

swing Python 版 的 Sun Microsystems Java/Swing (基于 Jython) 


http://jython. org 
您 还 能 从 Python 的 GUI 编程 简介 wiki 页 面 http://wiki. python. org/moin/GuiProgramming 上 
找到 更 多 有 关 Python GUI 编程 的 东西 。 








19.6 练习 





19-1. 客户 端 /服务 器 架构 。 请 描述 窗口 服务 器 的 角色 和 窗口 客户 端的 角色 。 





19-2. 面向 对 象 编程 。 请 描述 子 窗口 和 父 窗口 的 关系 。 





19-3. 标签 组 件 。 请 修改 tkhellol.py 脚本 ， 让 它 显示 您 自 定义 的 消息 而 非 “Hello World!” 








19-4. ”标签 和 按钮 组 件 。 请 修改 tkhello3.py 脚本 ， 除 了 QUIT 按钮 以 外 再 新 增 3 个 按钮 。 
按 下 这 3 个 按钮 中 的 任意 一 个 都 将 改变 标签 文字 ， 显 示 被 按 下 的 按钮 (组 件 ) 上 的 文字 。 





19-5. 标签 、 按 钮 和 单 选 按 钮 组 件 。 请 对 您 上 一 问题 的 答案 作 修 改 ， 用 3 个 单 选 按钮 实现 对 
标签 文字 的 选择 。 现 在 有 两 个 按钮 : QUIT 按钮 和 “更 新 ”按钮 。 当 更 新 按钮 被 按 下 时 ， 标 签 里 的 文 
字 变 成 选中 的 单项 按钮 上 的 文字 。 如 果 没 有 选中 任何 单 选 按钮 ， 则 标签 内 容 保持 不 变 。 





19-6. 标签、 按钮 和 文本 框 组 件 。 请 对 您 上 一 问题 的 答案 作 修 改 ， 用 一 个 单行 的 文本 框 组 件 
BAM 3 个 单 选 按 钮 ， 文 本 框 的 默认 值 为 “Hello World!”( 和 标签 的 初始 字符 串 保 持 一 致 )。 用 户 
可 以 编辑 文本 框 ， 输 入 新 的 字符 串 ， 标 签 组 件 会 在 更 新 按钮 被 按 下 时 显示 这 个 新 的 字符 串 。 


























19-7. 标签 、 文 本 框 组 件 及 Python I/0。 创 建 包含 一 个 文本 框 的 GUI 程序 ， 用 户 可 以 在 其 中 
输入 一 个 文本 文件 名 。 打 开 该 文件 并 读 取 ， 把 其 中 的 内 容 显 示 在 标签 组 件 上 。 附 加 题 ( 菜 单 ): 把 文 
本 框 换 成 一 个 包含 文件 打开 选项 的 菜单 ， 它 会 弹出 一 个 窗口 供用 户 选 择 要 读 取 的 文件 。 再 给 菜单 加 
上 一 个 Exit 或 Quit 选项 ， 这 样 就 用 不 着 QUIT 按钮 了 。 


E 
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19-8. 简单 的 文本 编辑 器 。 在 您 上 一 题 答案 的 基础 上 创建 一 个 简单 的 文本 编辑 器 。 可 以 用 剪 
贴 板 或 读 文 件 的 方式 在 一 个 文本 域 里 显示 一 些 文字 供用 户 编辑 。 当 用 户 退 出 程序 时 《通过 QUIT 按钮 
或 Quit/Exit 菜单 项 ) 会 询问 用 户 是 否 保存 所 作 的 修改 。 附 加 题 ， 给 您 的 脚本 添加 一 个 拼写 检查 接 
口 ， 增 加 一 个 按钮 或 菜单 项 来 对 文件 进行 拼写 检查 。 拼 写 错误 的 词句 应 在 文本 域 组 件 中 用 不 同 的 缘 
景 或 前 景色 高 亮 显示 出 来 。 


















































19-9. 多 线程 聊天 应 用 程序 。 第 13、16、17 章 讲 到 的 聊天 程序 可 以 完成 了 。 创 建 一 个 全 功 
能 的 多 线程 聊天 服务 器 。 这 个 服务 器 其 实 并 不 需要 有 GUI， 除 非 您 想 给 它 创建 一 个 前 端 配置 界面 ， 配 
置 诸如 端口 号 、 名 称 、 到 域名 服务 器 的 连接 等 。 创 建 一 个 多 线程 的 聊天 客户 端 ， 使 用 单独 的 线程 监 
视 用 户 输入 《〈 并 以 广播 方式 给 服务 器 发 送 消息 )， 另 一 个 线程 用 来 接收 消息 并 显示 给 用 户 。 客 户 端的 
GUI 聊天 窗口 应 当 由 两 部 分 组 成 : 较 大 的 部 分 用 来 多 行 显 示 所 有 的 对 话 ， 较 小 的 文本 域 用 来 接收 用 户 
输入 。 





























19-10. ”使 用 其 他 GUI。19.4 中 的 例子 使 用 到 了 各 种 各 样 的 工具 集 ， 这 些 GUI 程序 看 起 来 很 
相似 ; 然而 ， 它 们 并 不 完全 一 样 。 尽 管 不 可 能 让 所 有 的 例子 看 起 来 完全 一 样 ， 但 请 尽量 调整 它们 ， 
让 它们 比 现在 看 起 来 更 一 致 些 。 














19-11. 使 用 GUI 构建 工具 。 下 载 Boa Constructor (wxWidgets 平台 ) BK Glade (GTK+ 平 台 ) 
[或 者 都 下 载 ! ] ， 然 后 实现 那个 “动物 ”GUI 程序 ， 只 用 从 相应 的 工具 栏 拖 搜 一 些 组 件 就 好 了 。 给 








您 的 新 GUI 加 上 回调 函数 ， 让 它 能 有 本 章 例 子 程序 中 我 们 所 看 到 的 那些 行为 。 

















Edit By Vheavens 


Edit By Vheavens 


ee 





Web 编程 


qi 
Hr 
ge 


引言 

Python 的 Web 应 用 : 简单 的 Web 客户 端 
urlparse 和 urllib 模块 

高 级 的 Web 客户 端 
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20.1 介绍 


本 章 是 有 关 Web 编程 的 介绍 , 可 以 帮助 你 对 出 Python 在 因特网 上 的 各 种 基础 应 用 有 个 概要 了 
解 ， 例 如 通过 Web 页 面 建立 用 户 反馈 表单 ， 通 过 CGI 动态 生成 输出 页 面 


$ 20.1.1 Web 应 用 : 客户 端 /服务 器 计算 E 























Web 应 用 遵循 我 们 反复 提 到 的 客户 端 / 服 务 器 架构 。 这 里 ，Web 的 客户 端 是 浏览 器 ， 应 用 程序 多 
许 用 户 在 万 维 网 上 查询 文档 。 男 外 Web 服务 器 端 ， 进 程 运行 在 信息 提供 商 的 主机 上 。 这 些 服 务 器 等 
待 客户 和 文档 请 求 , 进行 相应 的 处 理 , 返回 相关 的 数据 。 正如 大 多 数 客 户 端 /服务 器 的 服务 器 端 一 样 ， 
Web 服务 器 端 被 设置 为 “永远 ”运行 。 图 20-1 列举 了 Web 应 用 的 体验 。 这 里 ， 一 个 用 户 执行 一 个 像 
浏览 器 的 这 类 客户 端 程序 与 Web 服务 器 取得 连接 ， 就 可 以 在 因特网 上 任何 地 方 获得 数据 。 



































£ The Internet 


^" Client 





图 20-1 因特网 上 的 Web 客户 端 和 Web 服务 器 。 在 因特网 上 客户 端 向 服务 器 端 发 送 一 个 请 求 ， 然 
后 服务 器 端 响应 这 个 请 求 并 将 相应 的 数据 返回 给 客户 端 。 
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客户 端 可 能 回 服 务 器 端 发 出 各 种 请 求 。 这 些 请 求 可 能 包括 获得 一 个 网 页 视图 或 者 提交 一 个 包含 
数据 的 表单 。 这 个 请 求 经 过 服务 器 端的 处 理 ， 然 后 会 以 特定 的 格式 (HTML 等 等 ) 返 回 给 客户 端 浏览 。 























Web 客户 端 和 服务 器 端 交 互 使 用 的 “语言 ”Web 交互 的 标准 协议 是 HTTP( 超 文本 传输 协议 )。HTTP 
协议 是 TCP/IP 协议 的 上 层 协议 ， 这 意味 着 HTTP 协议 依靠 TCP/IP 协议 来 进行 低层 的 交流 工作 。 它 的 
职责 不 是 路 由 或 者 传递 消息 (TCP/IP 协议 处 理 这 些 )， 而 是 通过 发 送 、 接 受 HTTP 消息 来 处 理 客户 站 
的 请 求 。 








HTTP 协议 属于 无 状态 协议 ， 它 不 跟踪 从 一 个 客户 端 到 另 一 个 客户 端的 的 请 求 信息 ， 这 点 和 我 们 
现今 使 用 的 客户 端 /服务 器 端 架 构 很 像 。 服 务 器 端 持续 运行 ， 但 是 客户 端的 活动 是 按照 这 种 结构 独立 
进行 的 : 一 旦 一 个 客户 的 请 求 完成 后 ， 活 动 将 被 终止 。 可 以 随时 发 送 新 的 请 求 ， 但 是 他 们 会 被 处 理 
成 独立 的 服务 请 求 。 由 于 每 个 请 求 缺乏 上 下 文 背景 ， 你 可 以 注意 到 有 些 URL 会 有 很 长 的 变量 和 值 作 
为 请 求 的 一 部 分 ， 以 便 提 供 一 些 状态 信息 。 另 外 一 个 选项 是 “cookie” 一 保存 在 客户 端的 客户 状态 
言 轧 。 在 本 章 的 后 面部 分 ， 我 们 将 会 看 到 如 何 使 用 URL 和 cookie 来 保存 状态 信息 。 


















































20. 1. 2 因特网 

















通路 ， 实 际 包含 了 不 定 节点 的 连通 。 作 为 一 个 客户 端 用 户 ， 所 有 这 些 实现 细节 都 会 被 隐藏 起 来 。 抽 
象 成 为 了 从 客户 端 到 所 访问 的 服务 器 端的 直接 连接 。 被 隐藏 起 来 的 HTP， TCP/IP 协议 将 会 处 理 所 
有 的 繁重 工作 。 中 间 的 环节 信息 用 户 并 不 关心 ， 所 以 将 这 些 执行 过 程 隐藏 起 来 是 有 好 处 的 。 图 20-2 
展示 了 因特网 的 扩展 视图 。 











因特网 是 一 个 连接 全 球 客 户 端 和 服务 器 端的 变 约 真 测 的 “ 迷 筋 ”。 客 户 端 最 终 连 接 到 服务 器 的 
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图 20-2 因特网 的 统 览 。 左 侧 指明 了 在 哪里 你 可 以 找到 Web 客户 端 ， 而 右 侧 则 暗示 了 Web 服务 
器 的 具体 位 置 。 








如 图 所 示 : 因特网 是 由 多 种 工作 在 一 定 规则 下 的 《也 许 非 连贯 的 ) 相互 连接 的 网 络 组 成 的 。 图 
表 左 侧 的 焦点 是 Web 客户 端 ， 在 家 上 网 的 用 户 通 过 拨号 连接 到 ISP《〈 因 特 网 供应 商 ) 上 ， 上 班 族 使 用 
的 则 是 公司 的 局 域 网 。 














图 表 的 右 半 部 分 关注 的 是 Web 服务 器 端 及 位 置 所 在 。 具 有 大 型 Web 站 点 的 公司 会 将 他 们 全 部 的 
“Web 服务 器 ” TCE ISP 那里 。 这 种 物理 安放 被 称 为 “整合 "， 这 意味 着 你 的 服务 器 和 其 它 客户 的 服 
务 器 一 同 放 在 ISP 处 被 “集中 管理 ”。 这 些 服 务 器 或许 为 客户 提供 了 不 同 的 数据 或 者 有 一 部 分 为 应 付 
重负 人 荷 〈 高 数量 用 户 群 ) 而 设计 成 了 可 以 存储 重复 数据 的 系统 。 小 公司 的 Web 站 点 或 许 不 需要 这 么 
大 的 硬盘 或 者 网 络 设备 ， 也 许 仅 有 一 个 或 者 几 个 “整合 ”服务 器 安放 在 他 们 的 ISP 处 就 可 以 了 。 











在 任何 一 种 情况 下 ， 大 多 数 “ 整 合 ” 服 务 器 被 部 署 在 大 型 ISP 提供 的 骨干 网 上 ， 这 意味 着 他 们 
具有 更 高 的 “带宽 ”如 果 你 愿意 , 可 以 更 接近 因特网 的 核心 点 , 从 而 可 以 更 快 的 与 因特网 取得 连接 。 
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这 就 允许 客户 端 可 以 绕 过 许多 网 络 直接 快速 的 访问 服务 器 ， 从 而 在 指定 的 时 间 内 可 以 使 得 更 多 的 客 
户 获得 服务 。 

















有 一 点 需要 记 清 楚 ，Web 应 用 是 网 络 应 用 的 一 种 最 普 衣 的 形式 , 但 不 是 唯一 的 也 不 是 最 古老 的 一 
种 形式 。 因 特 网 的 出 现 早 于 Web 近 三 十 年 。 在 Web 出 现 之 前 ， 因 特 网 主要 用 于 教学 和 科研 目的 。 
特 网 上 的 大 多 数 系 统 都 是 运行 在 Unix 平台 上 的 一 一 个 多 用 户 操作 系统 ， 许 多 最 初 的 因特网 协议 至 今 
仍 被 沿用 。 








这 些 协议 包括 telnet 允许 用 户 在 因特网 上 登录 到 远程 的 主机 上 ， 至 今 仍 用 )，FTP 协议 (文本 
传输 协议 ， 用 户 通 过 上 传 和 下 载 文件 可 以 共享 文件 和 数据 ， 至 今 仍 用 )，Gopher (Web 搜索 引擎 的 外 
形 一 一 个 在 互联 网 上 扑 动 的 小 软件 “gopher” 可 以 自动 寻找 你 感 兴趣 的 数据 )，SMTP 或 者 叫做 简单 邮 
件 传输 协议 (这 个 协议 用 于 最 古老 的 也 是 应 用 最 广泛 的 电子 邮件 )，NNTP (新 闻 对 新 闻 传输 协议 )。 














由 于 Python 的 最 初 偏重 就 是 因特网 编程 ， 除 了 其 他 一 些 东西 外 你 还 可 以 找到 上 边 提 及 的 所 有 协 
议 。 可 以 这 样 区 分 “因特网 编程 ”和 “Web 编程 ?， 后 者 仅 包括 针对 Web 的 应 用 程序 开发 ， 也 就 是 说 
Web 客户 端 和 服务 器 是 本 章 的 焦点 。 











因特网 编程 涵盖 更 多 范围 的 应 用 程序 : 包括 我 们 之 前 提 及 的 一 些 因 特 网 协议 ， 例 如 : FTP, SMTP 
等 ， 同 时 也 包括 我 们 前 一 章 提 到 的 网 络 编程 和 套 接 字 编 程 。 





g 20.2 使 用 Python 进行 Web 应 用 : 创建 一 个 简单 的 Web 客户 端 $ 





有 一 点 需要 记 清 楚 ， 浏 览 器 只 是 Web 客户 端的 一 种 。 任 何 一 个 通过 向 服务 器 端 发 送 请 求 来 获得 
数据 的 应 用 程序 都 被 认为 是 “客户 端 ”。 当 然 ， 也 可 以 建立 其 他 的 客户 端 从 而 在 因特网 上 检索 出 文档 
和 数据 。 这 样 做 的 一 个 重要 原因 就 是 浏览 器 的 能 力 有 限 ， 也 就 是 说 ， 它 主要 用 于 查看 并 同 其 他 Web 
站 点 交互 。 另 一 方面 ， 一 个 客户 端 程序 ， 有 能 力 做 得 更 多 一 它 不 仅 可 以 下 载 数据 ， 同 时 也 可 以 存储 、 
操作 数据 ， 甚 或 可 以 将 其 传送 到 另外 一 个 地 方 或 者 传 给 另外 一 个 应 用 。 






































一 个 使 用 urllib 模块 下 载 或 者 访问 Web 上 的 信息 的 应 用 程序 [使 用 urllib.urlopenO 或 者 
urllib. urlre- trieve O] 可 以 被 认为 是 简单 的 Web 客户 端 。 你 所 要 做 的 就 是 提供 一 个 有 效 的 Web 地 
址 。 








20. 2. 1 统一 资源 定位 符 


简单 的 Web 应 用 包 扩 使 用 被 称 为 URL (统一 资源 定位 器 ) 的 Web 地 址 。 这 个 地 址 用 来 在 Web EE 
位 一 个 文档 ， 或 者 调用 一 个 CGI 程序 来 为 你 的 客户 端 产生 一 个 文档 。URL 是 大 型 标识 符 URI〔 统 一 资 
源 标识 ) 的 一 部 分 。 这 个 超 集 是 建立 在 已 有 的 命名 惯例 基础 上 的 。 一 个 URL 是 一 个 简单 的 URI， 使 用 
已 存在 的 协议 或 规划 《〈 也 就 是 http，ftp 等 ) 作为 地 址 的 一 部 分 。 为 了 进一步 描绘 这 些 ， 我 们 将 会 
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引入 non-URL 的 URI， 有 时 这 些 被 成 为 URN (统一 资源 名 称 )， 但 是 在 今天 我 们 唯一 使 用 的 一 种 URI 
是 URL， 至 于 URI 和 URN 你 也 许 没有 听 到 太 多 ， 这 或 许 已 被 保存 成 XML 标识 符 了 。 














如 街道 地 址 一 样 ，Web 地 址 也 有 一 些 结构 。 美 国 的 街道 地 址 通常 是 这 种 格式 “号 码 街道 名 称 ” 
例如 123 主 大 街 。 这 个 和 其 他 国家 不 同 ， 他 们 有 自己 的 规则 。URL 使 用 这 种 格式 : 





prot sch://net loc/path;params?query#frag 





Table 20.1 Web Address Components 

URL 部 件 描述 

prot sch 网 络 协 议 或 者 下 载 规划 

net loc 服务 器 位 置 (或 许 也 有 用 户 信息 ) 

path RAL ( / ) 限定 文件 或 者 CGI 应 用 程序 的 路 径 。 
Params 可 选 参 数 

query 连接 符 ( & ) 连接 键 值 对 

frag 拆 分 文档 中 的 特殊 销 
































X 20. 1 描述 了 各 个 部 件 





net loc 可 以 进一步 拆 分 成 多 个 部 件 ， 有 些 是 必 备 的 ， 其 他 的 是 可 选 部 件 ，net_loc 字符 串 如 
p 
user: passwd@host: port 


X 20. 2 中 分 别 描述 了 这 些 部 件 。 





在 这 四 个 当中 ，host 主机 名 是 最 重要 的 。 端 口号 只 有 在 Web 服务 器 运行 其 他 非 默 认 端 口上 时 才 
会 被 使 用 。( 如 果 你 不 确定 所 使 用 的 端口 号 ， 可 以 参 到 第 十 六 章 )。 




















分 只 有 在 使 用 FTP 连接 时 候 才 有 可 能 用 到 ， 因 为 即使 是 使 用 FTP， 大 多 数 的 连接 
不 需要 用 户 名 和 密码 的 。 














用 户 名 和 密码 部 
都 是 使 用 匿名 这 时 是 











表 20. 2 网 络 定位 部 件 








net loc 

部 件 描述 

user 登录 名 

password 用 户 的 密码 

host Web 服务 器 运行 的 机 器 名 或 地 址 (必须 字段 ) 
port 端口 号 〈 默 认 80) 
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Python 支持 两 种 不 同 的 模块 ， 分 别 以 不 同 的 功能 和 兼容 性 来 处 理 URL。 一 种 是 urlparse， 一 种 
是 urllib。 这 里 我 们 将 会 简单 的 介绍 下 它们 的 功能 。 











20. 2.2 urlparse 模块 











urlpasrse 模块 提供 了 操作 URL 字符 串 的 基本 功能 。 这 些 功能 包括 urlparse(), urlunparse () 
和 urljoin (). 











urlparse () f URL 字符 串 拆 分 成 如 上 所 描述 的 一 些 主要 部 件 。 语 法 结构 如 下 : 

















urlparse(urlstr, defProtSch-None, allowFrag-None) 


urlparse() 将 urlstr 解析 成 一 个 6- 元 组 (prot sch, net loc,path, params, query, 
frag). 这 里 的 每 个 部 件 在 上 边 已 经 描述 过 了 。 如 果 urlstr 中 没有 提供 默认 的 网 络 协议 或 下 载 规 划 时 
可 以 使 用 defProtSch。allowFrag 标识 一 个 URL 是 否 允 许 使 用 零 部 件 。 下 边 是 一 个 给 定 URL 经 
urlparse() 后 的 输出 : 








SurIparse. urlparse (http://www. python. org/doc/FAQ. html’) 
Chttp', 'www.python.org', '/doc/FAQ html’, '', '', *’) 


urlparse. urlunparse () 
urlunparse O 的 功能 与 urlpase O0 完全 相反 一 它 拼合 一 个 6- 元 组 (prot_sch， net loc, path, 
params, query, frag)- urltup, 它 可 能 是 一 个 URL 经 urlparse O 后 的 输出 返回 值 。 于 是 ， 我 们 可 
以 用 如 下 方式 表示 : 





urlunparse(urlparse(urlstr)) = urlstr 
你 或 许 已 经 猪 到 了 urlunpase O 的 语法 ; 





urlunparse (url tup) 


urlparse. url join 
在 需要 多 个 相关 的 URL 时 我 们 就 需要 使 用 url join O 的 功能 了 ， 如 ,在 一 个 Web 页 中 生成 的 一 系 
列 页 面 的 URL。Urljoin() 的 语法 是 : 








urljoin(baseurl, newurl, allowFrag=None) 





Table 20.3 Core urlparse Module Functions 





$— 一 * 一 
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urlparse 功能 描述 

urlparse (urlstr， 

defProtSch=None, 

al lowFrag=None) 将 urlstr 解析 成 各 个 部 件 ， 如 果 在 rulstr 中 没有 给 定 协议 
或 者 规划 将 使 用 defProtSch; allowFrag REA $8 46 VF URL 
FHE 

urlunparse (url tup) F4 URL BE (url tup) 的 一 个 元 组 反 解 析 成 一 个 URL EATER « 

url join (baseurl, 

newurl, allowFrag -None) 将 URL 的 基部 件 baseurl 和 newurl 拼合 成 一 个 完整 的 URL; 








allowFrag 的 作用 和 urlpase () 中 相同 。 





urljoin (取得 baseurl, 并 将 其 基 路 径 (net loc 附加 一 个 完整 的 路 径 , 但 是 不 包括 终端 的 文件 ) 
与 newurl 连接 起 来 。 例 如 : 





2» urlparse. urljoin( http://www. python. org/doc/FAQ. html’, | 
. 'eurrent/lib/lib. htm’ ) 

"http://www. python. org/doc/current/Iib/lib.html' 

在 表 20. 3 中 可 以 找到 urlparse 的 功能 概述 。 


$ 20.2.3 urllib 模块 + 


核心 模块 :urllib 

urllib 模块 提供 了 所 有 你 需要 的 功能 ， 除 非 你 计划 写 一 个 更 加 低层 的 网 络 客户 端 。urllib 提供 
了 了 一 个 高 级 的 Web 交流 库 ， 支 持 Web Hi, HTTP, FTP 和 Gopher 协议 ， 同 时 也 支持 对 本 地 文件 的 
访问 。urllib 模块 的 特殊 功能 是 利用 上 述 协议 下 载 数据 (从 因特网 、 局 域 网 、 主 机 上 下 载 ) 。 使 用 这 
个 模块 可 以 避免 使 用 httplib， ftplib 和 gopherlib 这 些 模块 ， 除 非 你 想 用 更 低层 的 功能 。 在 那些 
情况 下 这 些 模块 都 是 可 选择 的 (注意 ; 大 多 数 以 *lib 命名 的 模块 用 于 客户 端 相 关 协 议 开 发 。 并 不 是 所 
有 情况 都 是 这 样 的， 或 许 urllib 应 该 被 命名 为 “internetlib” 或 者 其 他 什么 相似 的 名 字 ) 。 





Urllib 模块 提供 了 在 给 定 的 URL 地 址 下 载 数 据 的 功能 ， 同 时 也 可 以 通过 字符 串 的 编码 、 解 码 来 
确保 它们 是 有 效 URL 字符 串 的 一 部 分 。 我 们 接 下 来 要 谈 的 功能 包括 urlopenO,  urlretrieveO, 
quote(), unquote(), quote plus()， unquote plus()， 和 urlencode() 。 我 们 可 以 使 用 
urlopen (方法 返回 文件 类 型 对 象 。 你 会 觉得 这 些 方法 不 陌生 ， 因 为 在 第 九 章 我 们 已 经 涉及 到 了 文件 
方面 的 内 容 。 





























urllib. urlopen() 
urlopen() 打开 一 个 给 定 URL 字符 串 与 Web 连接 ， 并 返回 了 文件 类 的 对 象 。 语 法 结构 如 下 : 




















E 














Edit By Vheavens 


Edit By Vheavens 


e 
$ | - 


urlopen(urlstr, postQueryData=None) 
urlopen  1T7F urlstr PTFS lal AY URL. WRIA ENRE FRIR, RA NRE CARA, 
urlopen 0 则 会 打开 一 个 本 地 的 文件 。 














对 于 所 有 的 HTTP 请 求 ， 常 见 的 请 求 类 型 是 “GET”。 在 这 些 情况 中 ， 向 Web 服务 器 发 送 的 请 求 字 
ITE (编码 键 值 或 引用 ， 如 urlencode () 函数 的 字符 串 输 出 [如 下 ]) 应 该 是 urlstr 的 一 部 分 。 

















如 果 要 求 使 用 “POST” 方 法 ， 请 求 的 字符 串 (编码 的 ) 应 该 被 放 到 postQueryData 变量 中 。( 要 
了 解 更 多 关于 “GET” 和 “POST” 方 法 的 信息 ， 请 查看 CGI 应 用 编程 部 分 的 普通 文档 或 者 文本 ， 这 些 
我 们 在 下 边 也 会 讨论 )。GET POST 请 求 是 向 Web 服务 器 上 传 数据 的 两 种 方法 。 




















一 旦 连接 成 功 ，urlopen() 将 会 返回 一 个 文件 类 型 对 象 ， 就 像 在 目标 路 径 下 打开 了 一 个 可 读 文 
件 。 例 如 ， 如 果 我 们 的 文件 对 象 是 ff， 那 么 我 们 的 “句柄 ”将 会 支持 可 读 方 法 如 : f.readO, 
f.readline(, f.readlines(), f.close(), 和 f.fileno(). 








此 外 ，f. info (0) 方 法 可 以 返回 MIME (Multipurpose Internet Mail Extension， 多 目标 因 特 

网 邮件 扩展 ) 头 文件 。 这 个 头 文件 通知 浏览 器 返回 的 文件 类 型 可 以 用 哪 类 应 用 程序 打开 。 例 如 ， 浏 

览 器 本 身 可 以 查看 HTML (HyperText Markup Language， 超 文本 标记 语言 )， 纯 文本 文件 ， 生 成 〈 指 

由 数据 显示 图 像 一 一 译 者 注 ) PNG (Portable Network Graohics) 文件 ，JPEG (Joint Photographic 

$ Experts Group) 或 者 GIF (Graphics Interchange Format) 文件 。 其 他 的 如 多 媒体 文件 ， 特 殊 类 














型 文件 需要 通过 扩展 的 应 用 程序 才能 打开 。 





Table 20.4 urllib.urlopen() File-like Object Methods 








urlopenO 对 象 方法 描述 




















f. read([bytes]) 从 工 中 读 出 所 有 或 bytes 个 字 节 

f. readlineQ 从 工 中 读 出 一 行 

f.readlines () 从 f 中 读 出 所 有 行 并 返回 一 个 列表 
f. close Q 关闭 f 的 URL 的 连接 

f. fileno() 返回 f 的 文件 句柄 

f. info Q 获得 f 的 MIME 头 文件 

f. geturl () 返回 f 所 打开 的 真正 的 URL 








最 后 , geturl 0 方法 在 考虑 了 所 有 可 能 发 生 的 间接 导向 后 , 从 最 终 打开 的 文件 中 获得 真实 的 URL， 
这 些 文件 类 型 对 象 的 方法 在 表 20. 4 中 有 描述 。 














如 果 你 打算 访问 更 加 复杂 的 URL 或 者 想 要 处 理 更 复杂 的 情况 如 基于 数字 的 权限 验证 ， 重 定位 ， 
coockie 等 问题 ， 我 们 建议 你 使 用 urllib2 模块 ， 这 个 在 1.6 版 本 中 有 介绍 (多数 是 试验 模块 )。 它 
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同时 还 有 一 个 urlopen O 函数 ， 但 也 提供 了 其 他 的 可 以 打开 各 种 URL 的 函数 和 类 。 关 于 urllib2 的 更 
多 信息 ， 将 会 在 本 章 的 下 一 部 分 介绍 。 

















urllib. urlretrieve () 


如 果 你 对 整个 URL 文档 的 工作 感 兴趣 ，urlretrieve O 可 以 帮 你 快速 的 处 理 一 些 繁重 的 工作 。 下 


边 是 urlretrieve O 的 语法 : 











urlretrieve(urlstr, localfile=None, downloadStatusllook-None) 


除了 像 urlopen 这 样 从 URL 中 读 取 内 容 ，urlretrieve O 可 以 方便 地 将 urlstr 定位 到 的 整个 
HTML 文件 下 载 到 你 本 地 的 硬盘 上 。 你 可 以 将 下 载 后 的 数据 存 成 一 个 本 地 文件 或 者 一 个 临时 文件 。 如 
果 该 文件 已 经 被 复制 到 本 地 或 者 已 经 是 一 个 本 地 文件 ， 后 续 的 下 载 动 作 将 不 会 发 生 。 








如 果 可 能 ，downloadStatusHook 这 个 函数 将 会 在 每 块 数据 下 载 或 传输 完成 后 被 调用 。 调 用 时 使 
用 下 边 三 个 参数 : 目前 读 入 的 块 数 ， 块 的 字 节 数 和 文件 的 总 字 节 数 。 如 果 你 正在 用 文本 的 或 图 表 的 
视图 向 用 户 演示 “下 载 状态 ”信息 ， 这 个 函数 将 会 是 非常 有 用 的 。 








urlretrieve (返回 一 个 2- 元 组 ，(filename，mime hdrs).filename 是 包含 下 载 数 据 的 本 地 文 
件 名 ，mime_hdrs 是 对 Web 服务 器 响应 后 返回 的 一 系列 MIME 文件 头 。 要 获得 更 多 的 信息 ， 可 以 看 
mimetools 的 Message 类 。 对 本 地 文件 来 说 mime hdrs 是 空 也 





关于 urlretrieve O 的 简单 应 用 ， 可 以 看 11.4(grabweb. py) 中 的 例子 。 在 本 章 的 20. 2 中 将 会 
介绍 urlretrieve O 更 深层 的 应 用 。 


urllib.quote() and urllib.quote plus() 

quote*() 函数 获取 URL 数据 ， 并 将 其 编码 ， 从 而 适用 于 URL 字符 串 中 。 尤 其 是 一 些 不 能 被 打印 
的 或 者 不 被 Web 服务 器 作为 有 效 URL 接收 的 特殊 字符 串 必须 被 转换 。 这 就 是 quote O 函数 的 功能 。 
quote* () 函数 的 语法 如 下 : 





quote(urldata, safe="/) 

逗号 ， 下 划 线 ， 句 号 ， 斜 线 和 字母 数字 这 类 符号 是 不 需要 转化 。 其 他 的 则 均 需 要 转换 。 另 外 ， 
那些 不 被 允许 的 字符 前 边 会 被 加 上 百 分 号 (% 同时 转换 成 16 进 制 , 例如 :“%xx”“xx” 代 表 这 个 字母 
的 ASCII 码 的 十 六 进 制 值 。 当 调用 quotes 0], urldata 字符 串 被 转换 成 了 一 个 可 在 URL 字符 串 中 
使 用 的 等 价值 。safe 字符 串 可 以 包含 一 系列 的 不 能 被 转换 的 字符 。 默 认 的 是 斜 线 OD. 


























quote plusO 与 quote(O 很 像 ， 另 外 它 还 可 以 将 空格 编码 成 + 号 。 下 边 是 一 个 使 用 quote O 和 
quote plus O 的 例子 : 





22^ name = 'joe mama’ 
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222 number = 6 

22 base = 'http://www/ foo/cgi-bin/S. py’ 

2» final = °%s?name=%sknum=%d’ % (base, name, number) 
222^ final 

'http://www/ foo/cgi-bin/s. py?name=joe mama&num-6' 
之 2 

25» urllib. quote (final) 

http: %3a//www/b7efoo/cgi—bin/s. py%3fname%3d joe %20mama%26num%3d6’ 
225 

>> urllib.quote plus (final) 

"httpfíJa//www/U7efoo/cgi-bin/ 

s. py%3fname%3d joe tmama%26num%3d6" 








urllib. unquote() 和 urllib. unquote_plus() 


也 许 和 你 猪 到 的 一 样 , unquote () 函数 与 quote* O 函数 的 功能 安全 相反 一 它 将 所 有 编码 为 “%xx” 
式 的 字母 都 转换 成 它们 的 ASCII 码 值 。Unquote*0 的 语法 如 下 : 





unquote* (urldata) 








调用 unquote O 函数 将 会 把 urldata 中 所 有 的 URL- 编 码 字 母 都 解码 ， 并 返回 字符 串 。 
Unquote plus O 函数 会 将 加 号 转换 成 空格 符 。 





urllib. urlencode () 

f£ 1. 5. 2 fI] Python 中 ，urlopen O 函数 接收 字典 的 键 - 值 对 ， 并 将 其 编译 成 CGI 请 求 的 URL F 
符 串 的 一 部 分 。 键 值 对 的 格式 是 “ 键 = 值 ”, 以 连接 符 (&) 划 分 。 更 进一步 ， 键 和 它们 的 值 被 传 到 
quote plus O 函数 中 进行 适当 的 编码 。 下 边 是 urlencode O 输出 的 一 个 例子 : 

















> aDict = { 'name': 'Georgina Garcia’, 'hmdir': ' ggarcia! } 
25» urllib. urlencode (aDict) 
'name-Georgina*Garcia&hmdir-W/eggarcia' 


urllib 和 urlparse 还 有 一 些 其 他 的 功能 ,在 这 里 我 们 就 不 一 一 概述 了 。 阅 读 相 关 文档 可 以 获得 
更 多 信息 。 





安全 套 接 字 层 支持 

在 1.6 版 中 urllib 模块 通过 安全 套 接 字 层 (SSL) 文 持 开 放 的 HTTP 连接 . socket 模块 的 核心 变化 
是 增加 并 实现 了 SSL。 随后 ，urllib 和 httplib 模块 被 上 传 用 于 支持 URL 在 “https” 连 接 规划 中 
的 应 用 。 除 了 那 两 个 模块 以 外 ， 其 他 的 含有 SSL 的 模块 还 有 : imaplib，poplib 和 smtplib. 
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在 表 20. 5 中 可 以 看 到 关于 本 节 讨 论 的 urllib 函数 的 概要 总 结 。 














Table 20.5 Core urllib Module Functions 

urllib 函数 描述 

urlopen(urlstr, 

postQuery- Data-None) 打开 URL urlstr, 如 果 必 要 则 通过 postQueryData 发 送 请 求 。 

urlretrieve(urlstr, 

local- tusHook=None) 将 URL urlstr 定位 的 文件 下 载 到 localfile 或 临时 文件 中 ( 当 
localfile 没有 给 定时 )， 如 果 文 件 已 经 存在 downloaStatusHook 
将 会 获得 下 载 的 统计 信息 。 

quote(urldata, safe” /) 将 urldata 的 无 效 的 URL 字符 编码 ， 在 safe 列 的 则 不 必 编 码 。 

quote plus (urldata, 




















safe- /') 将 空格 编译 成 加 (+) 号 (并 非 %20) 外 ， 其 他 功能 与 quote O 相似 。 

unquote (urldata) 将 urldata 中 编码 后 的 字母 解码 

unquote plus (urldata) 除了 将 加 好 转换 成 空格 后 其 他 功能 与 unquote O 相似 。 

urlencode (dict) 将 字典 键 - 值 对 编译 成 有 效 的 CGI 请 求 字符 串 ， 用 quote plusO 
对 键 和 值 字 符 串 分 别 编码 。 











20.2.4 urllib2 模块 











正如 前 面 所 提 到 的 ，url11lib2 可 以 处 理 更 复杂 URL 的 打开 问题 。 一 个 例子 就 是 有 基本 认证 (登录 
名 和 密码 ) 需求 的 Web 站 点 。 最 简单 的 “获得 已 验证 参数 ”的 方法 是 使 用 前 边 章节 中 描述 的 URL 部 
件 net loc， 也 就 是 说 : http://user:passwdQwww. python. org. 这 种 解决 方案 的 问题 是 不 具有 可 编程 
性 。 然 而 使 用 urllib2， 我 们 可 以 通过 两 种 不 同 的 方式 来 解决 这 个 问题 。 









































我 们 可 以 建立 一 个 基础 认证 处 理 器 (urllib2. HTTPBasicAuthHandler), 同时 在 基本 URL 或 域 上 注 
册 一 个 登录 密码 ， 这 就 意味 着 我 们 在 Web 站 点 上 定义 了 个 安全 区 域 。( 关 于 域 的 更 多 信息 可 以 查看 
RFC2617[HTTP 认证 : 基本 数字 认证 ] )。 一 旦 完成 这 些 ， 你 可 以 安装 URL 打开 器 ， 通 过 这 个 处 理 器 打 
开 所 有 的 URL。 



































另 一 个 可 选 的 办 法 就 是 当 浏 览 器 提示 的 时 候 ， 输 入 用 户 名 和 密码 ， 这 样 就 发 送 了 一 个 带 有 适当 
用 户 请 求 的 认证 头 。 在 20. 1 的 例子 中 ， 我 们 可 以 很 容易 的 区 分 出 这 两 种 方法 。 
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普通 的 初始 化 过 程 ， 外 加 几 个 为 后 续 脚 本 使 用 的 常量 。 





9-15 行 

代码 的 “handler” 版 本 分 配 了 一 个 前 面 提 到 的 基本 处 理 器 类 ， 并 添加 了 认证 信息 。 之 后 该 处 理 
器 被 用 于 建立 一 个 URL-opener， 并 安装 它 以 便 所 有 已 打开 的 URL 能 用 到 这 些 认证 信息 。 这 段 代 码 和 
urllib2 模块 的 Python 官方 文档 是 兼容 的 。 


























Example 20.1 HTTP Auth Client (urlopenAuth. py) 
This script uses both techniques described above for basic authentication. 


1 #!//usr/bin/env python 
2 
3 import urllib2 
4 
5 LOGIN = ’wesc’ 
6 PASSWD = “you’ 11NeverGuess~ 
7 URL = 'http://Iocalhost' 
8 
9 def handler version (url): 
10 from urlparse import urlparse as up 
11 hdlr = urllib2. HTTPBasicAuthHandler () 
12 hdlr. add_password( Archives’, up(url) [1], LOGIN, PASSWD) 
13 opener = urllib2. build opener (hdir) 
14 urllib2. install opener (opener) 
15 return url 
16 
17 def request version(url): 
18 from base64 import encodestring 
19 req = urllib2. Request (url) 
20 b64str = encodestring ( %s:%s’ % (LOGIN, PASSWD)) [:-1] 
21 req. add header (Authorization, “Basic "s^ % b64str) 
22 return req 
23 
24 for funcType in (handler’, 'request'): 
25 print '"*** Using %s:°’ % funcType. upper 0 
26 url = eval( %s_ version’) (URL) 
27 f = urllib2. urlopen (url) 
28 print f. readline () 
29 f. close ) 
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17-2217 

这 段 代码 的 “request” 版 本 创建 了 一 个 Request WR, HE HTTP 请 求 中 添加 了 基本 的 base64 
编码 认证 头 信息 。 返 回 “main” 后 〈 译 者 注 : 指 for 循环 ) 调用 urlopen O 时 ， 该 请 求 被 用 来 蔡 换 其 
中 的 URL 字符 串 。 注 意 原始 URL 内 建 在 Requst 对 象 中 ， 正 因为 如 此 在 随后 的 urllib2. urlopen () 中 
调用 中 蔡 换 URL 字符 串 才 不 会 产生 问题 。 这 段 代码 的 灵感 来 自 于 Mike Foord 和 Lee Harr 在 Python 
Cookbook 上 的 回复 ， 有 具体 位 置 在 : 




















http://aspn. activestate. com/ASPN/Cookbook/Py thon/Recipe/305288 
http: //aspn. activestate. com/ASPN/Cookbook/Py thon/Recipe/267197 





如 果 能 直接 用 Harr 的 HTTPRealmFinder 类 就 更 好 了 ,那样 我 们 就 没 必 要 在 例子 里 使 用 便 编 码 了 。 


24 - 29 行 
这 个 脚本 的 剩余 部 分 只 是 用 两 种 技术 分 别 打 开 了 给 定 的 URL， 并 显示 服务 器 返回 的 HTML. 页 面 第 
一 行 (舍弃 了 其 他 行 )， 当 然 前 提 是 要 通过 认证 。 注 意 如 果 认 证 信息 无 效 的 话 会 返回 一 个 HTTP 错误 
(并 且 不 会 有 HTML). 

















程序 的 输出 应 当 如 下 所 示 : 4 


: $ python urlopen-auth. py 
Using handler: 


<html> 


Using request: 

<html> 

还 有 一 个 很 有 用 的 文档 可 以 在 

http://www. voidspace. org. uk/python/articles/urllib2. shtml 找到 , 你 可 以 把 它 作 为 Python 


官方 文档 的 补充 。 





20. 3 高 级 Web 客户 端 





Web 浏览 器 是 基本 的 Web 客户 端 。 主 要 用 来 在 Web 上 查询 或 者 下 载 文件 。 而 Web 的 高 级 客户 端 并 
不 只 是 从 因特网 上 下 载 文档 。 








高 级 Web 客户 端的 一 个 例子 就 是 网 络 疏 虫 (aka 蜘蛛 和 机 器 人 )。 这 些 程序 可 以 基于 不 同 目的 在 
因特网 上 探索 和 下 载 页 面 ， 其 中 包括 : 
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Edit By Vheavens 


Edit By Vheavens 





ee 


A Google Fil Yahoo AK AY ANIL 5| ER 5| 

脱 机 浏览 一 将 文档 下 载 到 本 地 ， 重 新 设 定 超 链接 ， 为 本 地 浏览 器 创建 镜像 。 
下 载 并 保存 历史 记录 或 框架 

Web 页 的 缓存 ， 节 省 再 次 访问 Web 站 点 的 下 载 时 间 。 











— 





34] PsP £8 ZA JE d : crawl. py, 抓 取 Web 的 开始 页 面 地 址 (URL)， 下 载 该 页 面 和 其 它 后 续 链 
接 页 面 ， 但 是 仅 限于 那些 与 开始 页 面 有 着 相同 域名 的 页 面 。 如 果 没 有 这 个 限制 的 话 ， 你 的 硬盘 将 会 
被 耗 尽 ! crwal. py 的 代码 在 例子 20. 2 中 展示 。 











逐 行 解释 一 个 类 一 个 类 的 ) 





1-11 行 

该 脚本 的 开始 部 分 包括 Python 在 Unix 上 标准 的 初始 化 行 以 及 一 些 模 块 属性 的 导入 ， 它 们 都 会 
在 本 应 用 程序 中 用 到 。 

13 - 49 fT 





Retriever 类 的 员 任 是 从 Web 下 载 页 面 ， 解 析 每 个 文档 中 的 链接 并 在 必要 的 时 候 把 它们 加 入 
“to-do” 队 列 。 我 们 为 每 个 从 网 上 下 载 的 页 面 都 创建 一 个 Retriever RASCH. Retriever 中 的 方 
法 展现 了 它 的 功能 : 构造 器 ( init OO. filename. 、download() 、 和 parseAndGetLinks () 。 




















: filename (方法 使 用 给 定 的 URL 找 出 安全 、 有 效 的 相关 文件 名 并 存储 在 本 地 。 大 体 上 说 ， 它 会 : 
去 掉 URL 的 “http://” 前 缀 ， 使 用 剩余 的 部 分 作为 文件 名 ， 并 创建 必要 的 文件 夹 路 径 。 那 些 没 有 
文件 名 前 级 的 URL 则 会 被 赋予 一 个 默认 的 文件 名 “index. htn”。( 可 以 在 调用 filename () 时 重新 指定 
这 个 名 字 。) 

















构造 器 实例 化 了 一 个 Retriever 对 象 ， 并 把 URL 和 通过 filename () 获得 的 相应 文件 名 都 作为 本 
地 属性 保存 起 来 。 








Example 20.2 Advanced Web Client: a Web Crawler (crawl. py) 





IKE BRE LFEPA, -NERAN crawling 进程 (Crawler) ,一 个 检索 并 解析 每 一 个 下 
载 的 Web 页 面 CRetriever). 








1#//usr/bin/env python 

2 

3from sys import argv 

4from os import makedirs, unlink, sep 

from os. path import dirname, exists, isdir, splitext 
6from string import replace, find, lower 
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7from htmllib import HTMLParser 
ófrom urllib import urlretrieve 


9from urlparse import urlparse, urljoin 


10 
11 
12 
13 
14 
15 
16 
17 
18 
19 
20 
21 
22 
23 
24 


from formatter import DumbWriter, AbstractFormatter 
from cStringlO import StringlO 


class Retriever (object) :£ download Web pages 


def | init (self, url): 
self. url = url 
self. file = self. filename (url) 


def filename (self, url, deffile=’ index. htm’): 
parsedurl = urlparse(url, 'http:', 0) ## parse path 
path = parsedurl[1/ + parsedurl[2] 

ext = splitext (path) 

If ext[1/ == '': # no file, use default 

if naihl-1] eX 


25 path += deffile 

26 else: 

27 path += "7/7 + deffile 

28 Idir = dirname(path) # local directory 


29 
30 
dd 
32 
33 
34 
oo 
56 
37 
58 
39 
40 
4] 
42 
43 
44 
45 








if sep /= '/:  # os-indep. path separator 
ldir = replace (ldir, '/', sep) 

if not isdir(dir): # create archive dir if nec. 
If exists (ldir): unlink (dir) 

makedirs (ldir) 

return path 


def download(self): # download Web page 
try: 

retval = urlretrieve(self. url, self. file) 
except lÜError: 

retval = ('*** ERROR: invalid URL “%s”~’ «| 
self. url, ) 

return retval 


def parseAndGetLinks (self) :# parse HTML, save links 
self. parser = HIMLParser (AbstractFormatter (| 
DumbWriter(StringlO ))) 
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47  self.parser. feed (open (self. file). read 0) 
49 self. parser. close () 
49 return self.parser. anchorlist 
50 
jl class Crawler (object):# manage entire crawling process 
32 
58 count = 0 # static downloaded page counter 
54 
55 def _ init (self, uri): 
56 self.q = [url] 
57 self seen = /J 
58 self. dom = urlparse (url) [1] 
59 
60 def getPage(self, url): 
61 r = Retriever (url) 
62 retval = r. download ) 
63 if retvalí(0] == '*': # error situation do not parse 
64 print retval, '... skipping parse’ 
65 return 


66 Crawler. count += 1 
67 print ’\n(, Crawler. count, °)’ 
68 print “URLS; url 


69 
70 
71 
72 
73 
74 
/9 
/6 
77 
78 
79 
80 
81 
82 
83 
84 
85 








print FILES retvallo/ 
self. seen. append (ur 1) 


links = r.parseAndGetLinks() # get and process links 
for eachLink in links: 

if eachLink[:4] /= 'http' and | 

find(eschLiínk. ?://) == -1: 

eachLink = urljoin(url, eachLink) 

print '* ', eachLink, 


if find(lower(eachLink), ’mailto:’) /= -I: 
print '... discarded, mailto link’ 


continue 


If eachLink not in self. seen: 

if find(eachLink, self. dom) == -1: 
print '... discarded, not in domain’ 
else: 
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87 
88 
89 
90 
91 
92 
93 
94 
95 
96 
OA 
98 
99 
100 
101 
102 


103 
104 
105 
106 
107 

108 

109 

110 

"PE 

112 

113 

114 


if eachLink not in self. q: 
self. q. append (eachLink) 
print '... new, added to Q' 


else: 

print '... discarded, already in Q’ 
else: 

print °’... discarded, already processed’ 


def go(self):f process links in queue 
while self.q: 

url = self. q. pop OQ 

self. getPage (ur1) 


def main(: 
if lon(argw-) > 1: 
url = argv[1/ 


else: 
try. 
url = raw input( Enter starting URL: ’) 
except (KeyboardInterrupt, EOFError): 


#2 


url = 
if not url: return 
robot = Crawler (url) 


robot. go () 


if name  -- ' main 





main Q 











正如 你 想象 的 ，download (0) 方法 实际 会 连 上 网 络 去 下 载 给 定 链接 的 页 面 。 它 使 用 URL 调用 
urllib. urlretrieve O 函数 并 把 结果 保存 在 filename 中 (该 值 由 filename ORE). WR FERRI, 
parse () 方 法 会 被 调用 来 解析 刚 从 网 络 拷贝 下 来 的 页 面 ， 否 则 会 返回 一 个 错误 字符 串 。 























如 果 Crawler 判定 没有 错误 发 生 ， 它 会 调用 parseAndGetLinks () 方 法 来 解析 新 下 载 的 页 面 并 决 
定 该 页 面 中 每 个 链接 的 后 续 动 作 。 


51-98 行 
Crawler 类 是 这 次 演示 中 的 “明星 ” 掌管 在 一 个 Web 站 点 上 的 整个 抓 候 过 程 。 如 果 我 们 为 应 用 
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程序 添加 线程 ， 就 可 以 为 每 个 待 抓 疏 的 站 点 分 别 创建 实例 。Crawler 的 构造 器 在 初始 化 过 程 中 存储 了 
3 样 东 西 ， 第 一 个 是 q， 一 个 待 下 载 链 接 的 队列 。 这 个 队列 在 运行 过 程 中 会 有 涨 落 ， 有 页 面 处 理 完毕 
它 就 变 短 ， 在 下 载 的 页 面 中 发 现 新 的 链接 则 会 让 它 变 长 。 

















Crawler 包含 的 男 两 个 数值 是 seen， 一 个 所 有 “我 们 已 看 过 ”( 已 下 载 ) 的 链接 的 列表 ， 和 dom, 
我 们 把 主 链接 的 域名 存储 在 这 里 ， 并 用 这 个 值 来 判定 后 续 链 接 是 否 是 该 域 的 一 部 分 。 











Crawler 还 有 一 个 静态 数据 成 员 count。 这 个 计数 器 只 是 用 来 保存 我 们 已 经 从 网 上 下 载 的 对 象 数 
目 。 每 有 一 个 页 面 成 功 下 载 它 就 会 增加 。 




















除了 构造 器 Crawler 还 有 其 他 两 个 方法 ，getPage() 和 goO go) 只 是 简单 的 启动 Crawler， 它 
在 代码 的 主体 部 分 被 调用 。go O 中 有 一 个 循环 ,只 有 队列 中 还 有 待 下 载 的 新 链接 它 就 会 不 停 的 执行 。 
然而 这 个 的 真正 工作 者 ， 却 是 getPage 0 方法 。 

















getPage O 初始 化 了 一 个 Retriever 对 象 ， 并 把 第 一 个 链接 赋 给 它 然后 让 它 执 行 。 如 果 页 面 下 载 
成 功 ， 计 数 器 会 增加 并 且 链 接 会 被 加 到 “已 看 ”列表 。 它 会 反复 地 检查 每 个 已 下 载 页 面 中 的 所 有 链 
接 并 判决 是 否 有 链接 要 被 加 入 待 下 载 队 列 。go O 中 的 主 循环 会 不 停 的 推进 处 理 过 程 直到 队列 为 空 ， 
这 时 便 大 功 告 成 。 






































链接 在 扩充 队列 时 都 会 被 忽略 掉 。 





属于 其 他 域 的 链接 、 已 经 下 载 过 的 链接 、 已 在 队列 中 待 处 理 的 链接 、 以 及 “mailto:” 类 型 的 


100-114 行 

main () 是 程序 运行 的 起 点 ， 它 在 该 脚本 被 直接 调用 时 执行 。 其 他 导入 crawl. py 的 模块 则 需要 调 
用 main Q RJA Sy Ab Re. main () 需要 一 个 URL 来 启动 处 理 ， 如 果 在 命令 行 指 定 了 一 个 《例如 这 个 
脚本 被 直接 调用 时 )， 它 就 会 使 用 这 个 指定 的 。 否 则 ， 脚 本 进入 交互 模式 ， 提 示 用 户 输入 起 始 URL. 
一 旦 有 了 起 始 链接 ，Crawler 就 会 被 实例 化 并 启动 开 来 。 






































一 个 调用 crawl. py 的 例子 如 下 所 示 : 





% crawl. py 
Enter starting URL: http://www. null. com/home/index. html 


(1) 

URL: http://www. null. com/home/index. html 

FILE: www. null. com/home/index. html 

* Attp://www. null. com/home/overview. html ... new, added to Q 
x Attp://www. null. com/home/synopsis. html ... new, added to Q 
* Attp://www. null. com/home/order. html ... new, added to Q 
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* mailto:postmaster@null. com... discarded, mailto link 

x http://www. null. com/home/overview. html ... discarded, already in Q 
x Attp://www. null. com/home/synopsis. html ... discarded, already in Q 
x Attp://www. null. com/home/order. html ... discarded, already in Q 

* mailto:postmaster@null. com... discarded, mailto link 

* http://bogus. com/index. html ... discarded, not in domain 

(2) 


URL: http://www. null. com/home/order. html 
FILE: www. null. com/home/order. html 


* mailto:postmaster@null. com... discarded, mailto link 

x http://www. null. com/home/index. html ... discarded, already processed 
* Attp://www. null. com/home/synopsis. html ... discarded, already in Q 

x Attp://www. null. com/home/overview.html ... discarded, already in Q 
(3) 


URL: http://www. null. com/home/synopsis. html 
FILE: www. null. com/home/synopsis. html 


* http://www. null. com/home/index. html ... discarded, already processed 
* Attp://www. null. com/home/order. html ... discarded, already processed 
* Attp://www. null. com/home/overview. html ... discarded, already in Q 
(4) 


URL: http://www. null. com/home/overview. html 
FILE: www. null. com/home/overview. html 


* Attp://www. null. com/home/synopsis. html ... discarded, already processed 
x Attp://www. null. com/home/index. html ... discarded, already processed 
* Attp://www. null. com/home/synopsis. html ... discarded, already processed 
* Attp://www. null. com/home/order. html ... discarded, already processed 





执行 后 , 在 本 地 的 系统 文件 中 将 会 在 创建 一 个 名 为 www. null. com 的 目录 , 及 分 目录 。 左 右 的 HTML 
文件 都 会 显示 在 主 目录 下 。 











20.4 CGI: 帮助 Web 服务 器 处 理 客户 端 数 据 
20. 4. 1 CGI 介绍 


Web 开发 的 最 初 目 的 是 在 全 球 范围 内 对 文档 进行 存储 和 归档 (大 多 是 教学 和 科研 目的 的 )。 这 些 
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零碎 的 信息 通常 产生 于 静态 的 文本 或 者 HTML 














HTML 是 一 个 文本 格式 而 算 不 上 是 一 种 语言 ， 它 包括 改变 字体 的 类 型 、 大 小 、 风 格 。HTML 的 主要 
特性 在 于 它 对 超 文 本 的 兼容 性 ， 文 本 以 一 种 或 者 是 高 亮 的 形式 指向 另外 一 个 相关 文档 。 可 以 通过 鼠 
标点 击 或 者 其 他 用 户 的 选择 机 制 来 访问 这 类 文档 。 这 些 静 态 的 HTML 文档 在 Web 服务 器 上 ， 当 有 请 求 
时 ， 将 被 送 到 客户 端 。 















































随 着 因特网 和 Web 服务 器 的 形成 , 产生 了 处 理 用 户 输入 的 需求 。 在 线 零售 商 需要 能 够 单独 订货 ， 
网 上 银行 和 搜索 引擎 需要 为 用 户 分 别 建立 帐号 。 因 此 发 明了 这 种 执行 模式 ， 并 成 为 了 Web 站 点 可 以 
从 用 户 那 里 获得 特 苏 信息 的 唯一 形式 (在 Java applets 出 现 之 前 )。 反 过 来 ， 在 客户 提交 了 特定 数 
据 后 ， 就 要 求 立 即 生 成 HTML 页 面 。 























现在 Web 服务 器 仅 有 一 点 做 的 很 不 错 ， 获 取 用 户 对 文件 的 请 求 ， 并 将 这 个 文件 (也 就 是 说 HTML 
文件 ) 返回 给 客户 端 。 它 们 现在 还 不 具有 处 理 字段 类 特殊 数据 的 机 制 。 将 这 些 请 求 送 到 可 以 生成 动 
AS HTML 页 面 的 扩展 应 用 程序 中 并 返回 给 客户 端 ， 这 些 还 没有 成 为 Web 服务 器 的 职责 。 





























这 整个 过 程 开 始 于 Web 服务 器 从 客户 端 接 到 了 请 求 〈GET 或 者 POST)， 并 调用 合适 的 程序 。 然 后 
开始 等 得 HTML 页 面 一 与 此 同时 ， 客 户 端 也 在 等 待 。 一 旦 程序 完成 ， 会 将 生成 的 动态 HTML. 页 面 返回 
到 服务 器 端 ， 然 后 服务 器 端 再 将 这 个 最 终结 果 返 回 给 用 户 。 服 务 器 接 到 表单 反馈 ， 与 外 部 应 用 程序 














交互 , 收 到 并 返回 新 生成 的 HTML 页 面 都 发 生 在 一 个 叫做 Web 服务 器 CGICCommon Gateway Interface) 
的 接口 上 . 图 20-3 描述 了 CGI 的 工作 原理 ， 逐 步 展示 了 一 个 用 户 从 提交 表单 到 返回 最 终结 果 Web 页 
面 的 整个 执行 过 程 和 数据 流 。 

















客户 端 输入 给 Web 服务 器 端的 表单 可 能 包括 处 理 过 程 和 一 些 存储 在 后 台数 据 库 中 的 表单 。 需 要 
记 住 的 是 ， 在 任何 时 候 都 可 能 有 任何 一 个 用 户 去 填写 这 个 字段 ， 或 者 点 击 提交 按钮 或 者 图 片 ， 这 更 
vo SARAH CGI 活动 。 





























创建 HTML 的 CGI 应 用 程序 通常 是 用 高 级 编程 语言 来 实现 的 ， 可 以 接受 、 处 理 数据 ， 向 服务 器 端 
返回 HTML 页 面 。 目 前 使 用 的 编程 语言 有 Perl, PHP, C/C++, 或 者 Python. 
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图 20-3 CGI 工作 概要 图 。CGI 代表 了 在 一 个 Web 服务 器 和 能 够 处 理 用 户 表 单 、 生 成 并 返回 动态 
HTML 页 的 应 用 程序 间 的 交互 。 








在 我 们 研究 CGI 之 前 ， 我 们 必须 告诉 你 典型 的 Web 应 用 产品 已 经 不 再 使 用 CGI 了 。 


由 于 它 词义 的 局 限 性 和 人 允许 Web 服务 器 处 理 大 量 模拟 客户 端 数 据 能 力 的 局 限 性 ，CGI 几乎 绝迹 。 

Web 服务 的 关键 使 命 依赖 于 遵循 像 C/C++ 这 样 语言 的 规范 。 如 今 的 Web 服务 器 典型 的 部 件 有 Aphache 

和 集成 的 数据 库 部 件 (MySQL 或 者 PostgreSQL), Java (Tomcat), PHP 和 各 种 Perl 模块 ，Python 模 

块 ， 以 及 SSL/security。 然 而 ， 如 果 你 工作 在 私人 小 型 的 或 者 小 组 织 的 Web 网 站 上 的 话 就 没有 必要 
he pe 








更 进一步 来 说 ,有 很 多 Web 应 用 程序 开发 框架 和 内 容 管 理 系统 ,这 些 都 弥补 了 过 去 CGI 的 不 足 。 E 
然而 ， 在 这 些 浓缩 和 升华 下 ， 它 们 仍旧 遵循 这 CGI 最 初 提供 的 模式 ， 可 以 允许 用 户 输入 ， 根 据 输 入 
执行 拷贝 ， 并 提供 了 一 个 有 效 的 HTML. 做 为 最 终 的 客户 端 输出 。 因 此 ， 为 了 开发 更 加 高 效 的 Web 服务 
有 必要 理解 CGI 实现 的 基本 原理 。 








在 下 一 部 分 中 ， 我 们 将 会 关注 在 cgi 模块 的 协助 下 如 何在 Python 中 建立 一 个 CGI 应 用 程序 。 


20.4.2 CGI 应 用 程序 





CGI 应 用 程序 和 典型 的 应 用 程序 有 些 不 同 。 主 要 的 区 别 在 于 输入 、 答 出 以 及 用 户 和 计算 机 交互 广 
面 。 当 一 个 CGI 脚本 开始 执行 时 ， 它 需要 检索 用 户 -支持 表单 ， 但 这 些 数据 必须 要 从 Web 的 客户 端 才 
可 以 获得 ， 而 不 是 从 服务 器 或 者 硬盘 上 获得 。 











这 些 不 同 于 标准 输出 的 输出 将 会 返回 到 连接 的 Web 客户 端 ， 而 不 是 返回 到 屏幕 、CUI 窗口 或 者 便 
盘 上 。 这 些 返回 来 的 数据 必须 是 具有 一 系列 有 效 头 文件 的 HTML。 否则 , 如 果 浏 览 器 是 Web 的 客户 端 ， 
由 于 浏览 器 只 能 识别 有 效 的 HTTP 数据 (也 就 是 MIME 都 问 价 和 HTML)， 那么 返回 的 也 只 能 是 个 错误 消 
恩 〈 且 体 的 就 是 因特网 服务 器 错误 )。 











最 后 ， 可 能 和 你 想象 的 一 样 ， 用户 不 能 与 脚本 进行 交互 。 所 有 的 交互 都 将 发 生 在 Web Zrim (用 


e 
* 





|e aa + 
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户 的 行为 )，Web 服务 器 端 和 CGI 应 用 程序 间 。 


20.4.2 cgi 模块 





在 cgi 模块 中 有 个 主要 类 : FieldStorage 类 ， 它 完成 了 所 有 的 工作 。 在 Python CGI 脚本 开始 时 
这 个 类 将 会 被 实例 化 ， 它 会 从 Web 客户 端 CAA Web 服务 器 ) 读 出 有 关 的 用 户 信 息 。 一 旦 这 个 对 象 
被 实例 化 ， 它 将 会 包含 一 个 类 似 字典 的 对 象 ， 具 有 一 系列 的 键 - 值 对 ， 键 就 是 通过 表单 传 入 的 表单 条 
目的 名 字 ， 而 值 则 包含 相应 的 数据 。 























这 些 值 本 身 可 以 是 以 下 三 种 对 象 之 一 。 它 们 既 可 以 是 FieldStorage 对 象 ( 实 例 ) 也 可 以 是 另 一 
个 类 似 的 名 为 MiniFieldStorage 类 的 实例 ， 后 者 用 在 没有 文件 上 传 或 mulitple-part 格式 数据 的 情 
况 。MiniFieldStorage 实例 只 包含 名 字 和 数据 的 键 - 值 对 。 最 后 ， 它 们 还 可 以 是 这 些 对 象 的 列表 。 这 
发 生 在 表单 中 的 某 个 域 有 多 个 输入 值 的 情况 下 。 























对 于 简单 的 Web 表单 ， 你 将 会 经 常 发 现 所 有 的 MiniFieldStorage 实例 。 下 边 包 含 的 所 有 的 例子 
都 仅 针对 这 种 情况 。 


20.5 建立 CGI 应 用 程序 
s 20.5.1 建立 Web 服务 器 E 
为 了 可 以 用 Python 进行 CGI 开发 ,你 首先 需要 安装 一 个 Web 服务 器 , 将 其 配置 成 可 以 处 理 Py thon 


CGI 请 求 的 模式 ， 然 后 让 你 的 Web 服务 器 访问 CGI 脚本 。 其 中 有 些 操作 你 也 许 需 要 获得 系统 管理 员 的 
帮助 。 












































如 果 你 需要 一 个 真正 的 Web 服务 器 ， 可 以 下 载 并 安装 Aphache. Aphache 的 插件 或 模块 可 以 处 理 
Python CGI， 但 这 在 我 们 的 例子 里 并 不 是 必要 的 。 如 果 你 准备 把 自己 的 服务 “ 带 入 真实 世界 “, 也 许 会 
想 安装 这 些 软件 。 尽 管 它们 似乎 过 于 强大 。 




















为 了 学 习 的 目的 或 者 是 建立 小 型 的 Web 站 点 ， 使 用 Python 自身 带 的 Web 服务 器 就 已 经 足够 了 。 
在 第 20.8 节 ， 你 将 会 实际 的 学 习 如 何 建立 和 配置 简单 的 基于 Python 的 Web 服务 器 。 如 果 你 想 在 本 
阶段 获得 更 多 知识 ， 你 也 可 以 现在 提前 阅读 那 部 分 。 然 而 ， 这 并 不 是 本 章 的 焦点 。 








如 果 你 只 是 想 建 立 一 个 基于 Web 的 服务 器 ， 你 可 以 直接 执行 下 边 的 Python 语句 。 


$ python -m CGIHTTPServer 





-nm 选项 是 在 2.4 中 新 引进 的 ， 如果 你 使 用 的 是 比 这 旧 的 Python 版 本 ， 或 者 想 看 下 它 执 行 的 不 同 
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方式 ， 请 看 14. 4. 3， 无 论 如 何 ， 最 终 它 需要 工作 起 来 . . . 

















这 将 会 在 当前 机 器 的 当前 目录 下 建立 一 个 端口 号 为 8000 的 Web 服务 器 。 然 后 可 以 在 启动 这 个 服 
务 器 的 目录 下 建立 一 个 Cgi - bin, 将 Python CGI 脚本 放 到 那里 。 将 一 些 HTML. 文件 放 到 那个 目录 下 ， 
或 许 有 些 . py CGI 脚本 在 Cgi-bin 中 ， 然 后 就 可 以 在 地 址 栏 中 输入 这 些 地址 来 访问 Web 站 点 啦 。 








http://localhost:8000/friends. htm http://localhost:8000/cgi-bin/friends2. py 


20.5.2 建立 表单 页 


在 例 20.3 中 ， 我 们 写 了 一 个 简单 的 Web 表单 ，friends. html. 


正如 你 可 以 在 代码 中 看 到 的 一 样 ， 这 个 表单 包括 两 个 输入 变量 : person 和 howmany, 这 两 个 值 
将 会 被 传 到 我 们 的 CGI 脚本 friendsl.py 中 。 


你 会 注意 到 在 例子 中 我 们 将 CGI 脚本 初始 化 到 主机 默认 的 cgi-bin 目录 下 (Action” 连 接 )。( 如 
果 这 个 信息 与 你 开发 环境 不 一 样 的 话 ， 在 测试 Web 页面 和 CGI 之 前 请 更 新 你 的 表单 事件 )。 同 时 由 于 
表单 事件 中 缺少 METHOD 子 标签 ， 所 有 的 请 求 将 会 采用 默认 的 GET 方法 。 选 择 GET 方法 是 因为 我 们 
的 表单 没有 太 多 的 字段 , 同时 我 们 希望 我 们 的 请 求 字段 可 以 在 “位 置 ”(aka “Address”， “Go To”) 
条 中 显示 ， 以 便 你 可 以 看 到 被 送 到 服务 器 端的 URL. 






































Example 20.3 Static Form Web Page (friends. htm) 











这 个 HTML 文件 展示 给 用 户 一 个 空 文档 ， 含 有 用 户 名 ， 和 一 系列 可 供用 户 选择 的 单 选 按钮 。 








I <HTML <HEAD> <TITLE> 

2Friends CGI Demo (static screen) 

3 </TITLE> </HEAD> 

4<BODY>HS>Friends list for: <DNEW USERC/D</H3> 
5<FORM ACTION- ^, cgi-bin/friendsl.py ^» 

6XB^Enter your Name:«/B^ 

7<INPUT TYPE-text MAME-person VALUE-^NEW USER^ SIZE=15> 
8<P<BHow many friends do you have?X/B^ 

9«INPUT TYPE-radio NAME-howmany VALUE-^0^ CHECKED» 0 
10 <INPUT TYPE=radio NAME-howmany VALUE-^10^» 10 
11 <INPUT TYPE=radio NAME-howmany VALUE-^25^» 25 
12 <INPUT TYPE=radio NAME=howmany VALUE-^50^» 50 
<INPUT TYPE=radio NAME=howmany VALUE-^100^» 100 
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14 <P><INPUT TYPE-submi t></FORWD </BODY> </HTML> 














SOC GI Demo (static 
CHE | d @ http://localhost:8000/friends.htm 





Friends list for: NEW USER 
Enter your Name: NEWUSER | 
How many friends do you have? & 0 © 10 © 25 © 50 © 100 


C—O Ss 
图 20-4 





20-4, Friends 表单 页 面 在 MacOS X 操作 系统 Safari 浏览 器 上 的 显示 (friends. htm) 





让 我 们 看 看 friends. htm 提交 后 在 客户 端 屏幕 上 的 显示 (图 20-4Safari，Mac0S 和 图 20-5 IE6) 





&) http;//localhost;OO00/Fiiends.htr 





Friends list for: NEW USER 


Enter your Name: [NEW USER 


How many friends do you have? @ 0 C 10 © 25 © 50 © 100 

















图 20-5 





图 20-5 friends 表单 页 面 在 Win32 操作 系统 IE6 浏览 器 上 的 显示 (friends. htm) 


+ + 
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通过 本 章 ， 我 们 将 会 展示 来 自 与 不 同 Web 浏览 器 和 操作 系统 的 屏幕 截图 。 





20. 5. 3 生成 结果 页 





这 些 输入 是 由 用 户 完 成 的 ， 然 后 按 下 了 “Submit” 按 钮 (可 选 的 ， 用 户 也 可 以 在 该 文本 字段 中 
按 下 回 车 键 获得 相同 的 效果 。) 当 这 些 发 生 后 ， 在 例 20. 4 中 的 脚本 ， friendsl. py 将 会 随 CGI 一 起 
被 执行 。 

















这 个 脚本 包含 了 所 有 的 编程 功能 ， 读 出 并 处 理 表单 的 输入 ， 同 时 向 用 户 返 回 结果 HTML 页 面 。 所 
有 的 这 些 “ 实 际 ” 的 工作 仅 是 通过 四 行 Python 代码 来 实现 的 〈14-17 行 )。 








表单 的 变量 是 FieldStorage 的 实例 ， 包 含 person 和 hownanyh 字段 的 值 。 我 们 把 这 些 值 本 分 别 
存 入 Python 的 who 和 hownany 变量 中 。 变 量 reshtml 包含 需要 返回 的 HTML 文本 的 正文 ， 还 有 一 些 
动态 填 好 的 字段 ， 这 些 数据 都 是 从 表单 中 读 入 的 。 











Example 20.4 Results Screen CGI code (friendsl. py) 
CGI 脚本 在 表单 上 抓 取 person 和 howmany 字段 ， 并 用 这 些 数据 生成 动态 的 结果 示 图 。 


1 #!/usr/bin/env python 


2 

Simport cgi 

4 

5reshtml = ’’’ Content-Type: text/html \n 
6 <HTML> <HEAD> <TITLE> 

7Friends CGI Demo (dynamic screen) 
8</TITLES</HEAD 


9<BODY><H3>Friends list for: <D%4s</D</HD> 
10 Your name is: <B%s</B<P> 

ll You have <B%s</B friends. 

12 | </BODY></HTML>’’’ 

13 

14 form = cgi. FieldStorage () 

15 who = formí person’ J. value 

16 | howmany = form[’ howmany’ J. value 

17 print reshtml % (who, who, howmany) 








$— 一 * 一 
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核心 提示 :HTML 头 文件 是 从 HTML 中 分 离 出 来 的 。 

有 一 点 需要 向 CGI 初学 者 指明 的 是 ， 在 向 CGI 脚本 返回 结果 时 ， 须 先 返 回 一 个 适当 的 HTTP 头 文 
件 后 才 会 返回 结果 HTML. 页面。 进一步 说 ,为 了 区 分 这 些 头 文件 和 结果 HTML. 页 面 ,需要 在 friendsl. py 
的 第 五 行 中 插入 几 个 换行 符 。 在 本 章 的 后 边 的 代码 中 也 是 这 样 的 处 理 。 





20-6 是 可 能 出 现 的 屏幕 ， 假 设 用 户 输 入 的 名 字 为 “erick allen”, 单 击 “10 friends” 单 选 
按钮 。 这 次 的 屏幕 镜像 图 展示 的 是 在 Windows 环境 下 IE3 浏览 器 的 效果 。 





如 果 你 是 一 个 Web 站 点 的 生产 商 ， 你 也 许 会 想 , “如 果 这 个 人 瑟 记 了 的 话 ， 我 能 自动 的 将 这 个 人 
的 名 字 大 写 ,会 不 会 更 好 些 ? ”这 个 通过 Python 的 CGI 可 以 很 容易 就 实现 (我 们 很 快 就 会 进行 试验 !)。 








注意 GET 请 求 是 如 何 将 表单 中 的 变量 和 值 加 载 在 URL 地 址 条 中 的 。 你 是 否 观察 到 了 friends. htm 
页 面 的 标题 有 个 “static”， 

而 friends. py 脚本 输出 到 屏幕 上 的 则 是 “dynamic”? 我 们 这 样 做 的 一 个 原因 就 是 ， 指明 
friends. htm 文件 是 一 个 静态 的 文本 ， 而 结果 页 面 却 是 动态 生成 的 。 换 句 话说 ， 结 果 页 面 的 HTML 不 
是 以 文本 文件 的 形式 存在 硬盘 上 的 ， 而 是 由 我 们 的 CGI 脚本 生成 的 ， 并 且 将 其 以 本 地 文件 的 形式 返 
Hl. 















[Fj Friends CGI Demo (dynamic screen) - Microsoft Internet Explorer Mim] Ea 
File Edit View Go Favorites Help 


Address |http:Moacalhosticgi-binsfriends1 py?person-erick*allen&howmanyz1 0 区 





Friends list for: erick aHen 
Y out name is: erick allen 


You have 10 friends. 


Kl 20-6 





20-6 Friends 的 结果 页 面 在 Win32 操作 系统 IES 浏览 器 上 的 显示 


在 下 边 的 例子 中 , 我 们 将 会 更 新 我 们 的 CGI 脚本 ,使 其 变 得 更 灵活 些 ， 从 而 完全 绕 过 静态 文件 。 
20. 5. 4 生成 表单 和 结果 页 面 


我 们 删除 fiends. html 文件 并 将 其 合并 到 friends2. py 中 。 这 个 脚本 现在 将 会 同时 生成 表单 页 
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和 结果 页 面 。 但 是 我 们 如 何 控制 生成 哪个 页 面 呢 ? 好 吧 ， 如 果 有 表单 数据 被 发 送 ， 那 就 意味 着 我 们 
需要 建立 一 个 结果 页 面 。 如 果 我 们 没有 获得 任何 的 信息 ， 这 就 说 明 我 们 需要 生成 一 个 用 户 可 以 输入 
数据 的 表单 页 面 。 

















例子 20. 5 展示 的 就 是 我 们 的 新 脚本 friends2. py 

那么 我 们 改变 了 哪些 脚本 呢 ? 让 我 们 一 起 看 下 这 个 脚本 的 代码 块 。 

逐 行 解释 

1-5 行 

除了 通常 的 起 始 、 和 模块 导入 行 ， 我 们 还 把 HTTP. MIMI 头 从 后 面 的 HTML 正文 部 分 分 离 出 来 ， 放 


在 了 这 里 。 因 为 我 们 将 在 返回 的 两 种 页 面 〈 表 单 页 面 和 结果 页 面 ) 中 都 使 用 它 ， 而 又 不 想 重 复写 文 
本 。 当 需要 输出 时 ， 我 们 将 把 这 个 头 字 串 加 在 相应 的 HTML 正文 中 。 

















7-29 行 
所 有 这 些 代码 都 是 为 了 整合 CGI 脚本 里 的 friends. htm 表单 页 面 。 我 们 对 表单 页 面 的 文本 使 用 
一 个 变量 formhtml， 还 有 一 个 用 来 创建 单 选 按钮 的 字符 串 变 量 fradio。 我 们 从 friends. htm 复制 了 
这 个 单 选 按钮 HTML 文本 ， 但 我 们 意 在 展示 如 何 使 用 Python 来 生成 更 多 的 动态 输出 一 见 22-27 行 的 
for 循环 。 














showForm() 函数 负责 对 用 户 输入 生成 表单 页 。 它 为 单 选 按钮 创建 了 一 个 文字 集 ， 并 把 这 些 HTML + 
文本 行 合 并 到 了 formhtml 主体 中 ， 然 后 给 表单 加 上 头 信息 ， 最 后 通过 把 整个 字符 串 输 出 到 标准 输出 
的 方式 给 客户 端 返回 了 整 块 数据 。 











例 20.5 生成 表单 和 结果 页 面 (friends2. py) 
将 friends. html 和 friendsl.py 合并 成 friends2. py. 得 到 的 脚本 可 以 同时 显示 表单 和 动态 生 
成 的 HTML 结果 页 面 ， 同 时 可 以 巧妙 的 知道 应 该 输出 哪个 页 面 。 





7 #l/usr/bin/env python 

2 

3 import cgi 

4 

5 header = ’Content-Type: text/html \n\n’ 
6 

7 formhtml = ’’’ <HIML><HEAD<TITLE> 

8 Friends CGI Demo</TITLE> </HEAD> 

9 <BODY<H3>Friends list for: <DNEW USER</D</H2> 
10 <FORM ACTION="/cgi-bin/friends2. py” 
11 <BEnter your Name: /BS 
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12 <INPUT TYPE-hidden MAME-action VALUE=edi t> 
13 <INPUT TYPE=text NAME-person VALUE-^NEW USER” SIZE=15> 
14 <P>)<B>How many friends do you have?</B 





15 “s 

16 <P><INPUT TYPE-submi t></FORID</BODY</HTML»’ ' * 

17 

18 fradio = °’ <INPUT TYPE-radio NAME=howmany VALUE-^ s^ %s> %s\n’ 
19 


20 def showForm(: 

21 friends = 一 

22 for i in [0, 10, 25, 50, 100/: 
23 checked = '' 

24 if i = 

25 checked = ° CHECKED’ 

26 friends = friends + fradio % | 
27 (str(i), checked, str(i)) 


28 

29 print header + formhtml % (friends) 
30 

31 reshtml = ''' <HTML><HEAD<TITLED 


32 Friends CGI Demo</TITLE> </HEAD> 

33 <BODY>HS>Friends list for: <D%s</D</H> 
34 Your name is: <B>%s</B><P> 

35 You have <B>%s</B> friends. 

36 CBODYO«/HTML^' '* 

37 

38 def doResults (who, howmany): 

39 print header + reshtml % (who, who, howmany) 
40 

41 def process): 

42 form = cgi. FieldStorage () 

43 if form.has key( person’): 

44 who = form[’ person’ J. value 

45 else: 

46 who = 'NEW USER’ 

47 

48 if form. has key( howmany’): 

49 howmany = formí howmany’ J. value 

50 else: 

51 howmany = 0 
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e: 
52 
53 if form. has key( action’): 
54 doResults (who, howmany) 
55 else: 
56 showForm () 


87 
58 if name = ' main 








59 process () 














这 段 代 码 中 有 两 件 有 趣 的 事 值得 注意 。 第 一 点 是 表单 中 12 fT action 处 的 "hidden" 变量 ， 这 
里 的 值 为 “edit”。 我 们 决定 显示 哪个 页 面 〈 表 单 页 面 或 是 结果 页 面 ) 的 唯一 途径 是 通过 这 个 字段 。 
我 们 将 在 第 53-56 行 看 到 这 个 字段 如 何 起 作用 。 

还 有 ， 请 注意 我 们 在 生成 所 有 按钮 的 循环 里 把 单 选 按钮 0 设置 为 默认 按钮 。 这 表明 我 们 可 以 在 
一 行 代码 里 (第 18 行 ) 更 新 单 选 按钮 的 布局 和 /或 它们 的 值 ， 而 不 用 再 写 多 行文 字 。 这 也 同时 提供 
了 更 多 的 灵活 性 ， 可 以 用 逻辑 来 判断 哪个 单 选 按钮 被 选中 一 见 我 们 脚本 的 下 一 个 升级 版 ， 后 面 的 
friends3. py。 

现在 你 或 许 会 想 * 既然 我 也 可 以 选择 person 或 howmany 是 否 出 现 , 那 为 什么 我 们 要 用 一 个 action 
变量 呢 ? ”这 是 一 个 很 好 的 问题 ， 因 为 在 这 种 情况 下 你 当然 可 以 只 用 person 或 hwomany。 

然而 ，action 变量 代表 了 一 种 更 明显 的 出 现 , 不 光 是 它 的 名 字 还 有 它 的 作用 一 其 代码 很 容易 理 
fi. person 和 hownany 变量 都 是 对 其 值 起 作用 ， 而 action 变量 则 被 用 作 一 个 标志 。 

创立 action 的 另 一 个 原因 是 我 们 将 会 再 一 次 使 用 它 来 帮助 我 们 决定 生成 哪 一 页 。 具 体 来 说 ， 
我 们 需要 在 person 变量 出 现时 会 显示 一 个 表单 (而 不 是 生成 结果 页 面 ) 一 如 果 在 这 里 仅 依 赖 person 
变量 , 你 的 代码 运行 将 失败 。 





























31-39 1T 
显示 结果 页 的 代码 实际 上 和 friendsl.py 中 的 一 样 。 





CJ Friends CGI Demo - Mozilla Firefox | - | P] xl 
File Edit View Go Bookmarks Tools Help 


«^r t» - E © A | 器 http:;/localhost:8D00/cgi-bin/friends2 ,py 


| Friends list for: NEW USER 


| Enter your Name: [john doe 


| How many friends do you have? © 0 € 10 @ 25 C 50 © 100 


Submit Query | 
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20-7 Friends 表单 页 面 在 Win32 操作 系统 Firefox 1.x 浏览 器 上 的 显示 (friends2. py) 





图 20-7 





41-56 行 

因为 这 个 脚本 可 以 产生 出 不 同 的 页 面 , 所 以 我 们 创建 了 一 个 包括 一 切 的 process O 函数 来 获得 表 
单数 据 并 决定 采用 何 种 动作 ,看 起 来 process () 的 主体 部 分 也 和 friendsl. py 中 主体 部 分 的 代码 相似 。 
然而 它们 有 两 个 主要 的 不 同 。 





因为 这 个 脚本 也 许可 以 、 也 许 不 能 取得 所 期 待 的 字段 〈 例 如 ， 第 一 次 运行 脚本 时 生成 一 个 表单 
页 ， 这 样 的 话 就 不 会 给 服务 器 传递 任何 字段 )， 我 们 需要 用 if 语句 把 从 表单 项 取得 的 值 “ 括 起 来 ” 
并 检查 它们 此 时 是 否 有 效 。 还 有 我 们 上 面 提 到 的 action 字段 ， 它 可 以 帮助 我 们 判定 应 生成 哪 一 个 页 
面 。 第 53-56 行 作 了 这 种 判定 。 


在 图 20-7 和 图 20-8 中 ， 你 会 先 看 到 脚本 生成 的 表单 页 面 〈 已 经 输入 了 一 个 名 字 并 选择 了 一 个 
单 选 按钮 )， 然 后 是 结果 页 面 ， 也 是 这 个 脚本 生成 的 。 


如 果 看 一 下 位 置 或 “ 转 到 ” 栏 ， 你 将 不 会 看 到 一 个 对 friends. htm 静态 文件 的 URL， 而 在 图 20-4 
或 图 20-5 中 都 有 。 


20.5.5 全 面 交 互 的 Web 站 点 * 


我 们 最 后 一 个 例子 将 会 完成 这 个 循环 。 如 在 前 面 中 ， 用 户 在 表单 页 中 输入 他 /她 的 信息 ， 然 后 我 
们 处 理 这 些 数据 , 并 输出 一 个 结果 页 面 。 现 在 我 们 将 会 在 结果 页 面 上 加 个 链接 允许 返回 到 表单 页 面 ， 
但 是 我 们 返回 的 是 含有 用 户 输入 信息 的 页 面 而 不 是 一 个 空白 页 面 。 我 们 页 加 上 了 一 些 错误 处 理 程序 ， 
来 展示 它 是 如 何 实现 的 。 





©) Friends CGI Demo - Mozilla Firefox | - [ml x! 
File Edit view Go Bookmarks Tools Help 


<a m i m E a B http://localhost:8000/cgi-bin/Friends2 ,py?acl Y 


Friends list for: john doe 





Your name is: john doe 


You have 25 friends. 








aa + 
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20-8 Friends 结果 页 面 在 Win32 操作 系统 Firefox 浏览 器 上 的 显示 (friends2. py) 
现在 在 例子 20. 6 中 我 们 展示 我 们 最 后 的 更 新 ，friends3. py。 








friends3. py 和 friends2. py 没有 太 大 的 不 同 。 我 们 请 读者 比较 不 同 处 ; 这 里 我 们 简要 的 介绍 了 
主要 的 不 同 点 。 





简略 的 逐 行 解释 


第 8 行 
我 们 把 URL 从 表单 中 抽出 来 是 因为 现在 有 2 个 地 方 需要 它 ， 结 果 页 面 是 它 的 新 顾客 。 














10-19, 69-71, 75-82 行 
所 有 这 些 行 都 用 来 处 理 新 特性 一 错误 页 面 。 如 果 用 户 没 有 选择 单 选 按 钮 ， 指 明 朋 友 数 量 ， 那 么 
howmany 字段 就 不 会 传送 给 服务 器 ， 在 这 种 情况 下 ，showError (函数 会 返回 一 个 错误 页 面 给 客户 。 


























错误 页 面 的 显示 使 用 了 JavaScript 的 “后 退 ” 按 钮 。 因 为 按钮 都 是 输入 类 型 的 ， 所 以 需要 一 个 

表单 ， 但 不 需要 有 动作 因为 我 们 只 是 简单 的 后 退 到 浏览 器 历史 中 的 上 一 个 页 面 。 尽 管 我 们 的 脚本 目 

1 前 只 支持 (或 者 说 探测 、 测 试 ) 一 种 类 型 的 错误 ， 但 我 们 仍然 使 用 了 一 个 通用 的 error 变量 ， 这 是 
T 为 了 以 后 还 可 以 继续 开发 这 个 脚本 ， 给 它 增加 更 多 的 错误 检测 。 
































例 20. 6 全 用 于 交互 和 错误 处 理 (friends3. py) 

通过 加 上 返回 输入 信息 的 表单 页 面 的 连接 ， 我 们 实现 了 整个 循环 ， 给 了 用 户 一 次 完整 的 Web 应 
用 体验 。 我 们 的 应 用 程序 现在 也 进行 了 一 些 简 单 的 错误 验证 ， 在 用 户 没 有 选择 任何 单 选 按钮 时 ， 可 
以 通知 用 户 。 




















7 #!/usr/bin/env python 

2 

3 import cgi 

4 from urllib import quote plus 

5 from string import capwords 

6 

7 header = 'Content-Type: text/html|n|n' 
8 url = '/cgi-bin/friends3. py’ 

9 

10 errhtml = ’’’ <HTML><HEAD<TITLE> 
11 Friends CGI Demo<s</TITLED</HEAD 
12 <BODY><H3>ERROR</H3> 

13 Bs SBP 











$— 一 * 一 
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14 <FORID<INPUT TYPE-button VALUE=Back 

15 ONCLICK-^window. history. back OQ </FORM> 
16 </BODYD</HTML>’’’ 

17 

18 def showError (error str): 





19 print header + errhtml % (error str) 

20 

21 formhtml = <HIML><HEAD<TITLE> 

22 Friends CGI Demo</TITLED</HEAD 

23 <BODYS<H3>Friends list for: <D%s</D</HD> 

24 «FORM ACTION-^ s ^» 

25 <B>Your Name: </B> 

26 <INPUT TYPE-hidden NAME=action VALUE-edit»^ 

27 <INPUT TYPE=text NAME=person VALUE-^ s^ SIZE=15> 
28 <P><B>How many friends do you have?</BE 

29 %s 

30 <P><INPUT TYPE-submi t^ /FORMS BODY ATMS” ** 
31 

32 fradio = <INPUT TYPE=radio NAME-howmany VALUE-^ s^ fs» 
%s\n° 

33 

34 def showForm(who, howmany): 

85 friends — '' 

36 for i in [0, 10, 25, 50, 100/: 

37 checked = 一 

38 if str(i) == howmany: 

39 checked = ’ CHECKED’ 

40 friends = friends + fradio % | 

41 (str(i), checked, str(i)) 

42 print header + formhtml % (who, url, who, friends) 
43 

44 reshtml = ’’’ <HTML><HEAD<TITLE> 

45 Friends CGI Demo</TITLE></HEAD 

46 <BODY>HS>Friends list for: <D%s</D</HSD> 

47 Your name is: <B>%s</B><P> 

48 You have <B>%s</B> friends. 

49 <P>Click «A HREF=“%s here /A> to edit your data again. 
50 </BODY></HTML>’’’ 

51 

52 def doResults (who, howmany): 
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ee 
T | 


53 newurl = url + ’ ?action=reedit&person=%skhowmany=%s ' fi | 





54 (quote plus (who), howmany) 
55 print header + reshtml % (who, who, howmany, newurl) 


56 

57 def process(): 

58 error = '' 

59 form = cgi. FieldStorage () 
60 


61 if form. has_key( person’): 
62 who = capwords (form[’ person’ J. value) 
63 else: 
64 who = 'NEW USER’ 
65 
66 if form. has key( howmany ): 
67 howmany = form[’ howmany’ J. value 
68 else: 
69 if form.has key( action’) and | 
70 form[’ action’ /. value == 'edit': 
71 error = 'Please select number of friends.’ 
72 else: 
73 howmany = O 
74 
75 if not error: 
76 if form. has key( action’) and | 
77 form[’action’ /. value /= 'reedit': 
78 doResults (who, howmany) 


79 else: 

80 showForm (who, howmany) 
81 else: 

82 showError (error) 

83 

84 if name ==’ main 





85 process () 


27, 38-41, 49, 52-55 行 

这 个 脚本 的 一 个 目的 是 创建 一 个 有 意义 的 链接 ， 以 便 从 结果 页 面 返回 表单 页 面 。 当 有 错误 发 生 
时 ， 用 户 可 以 使 用 这 个 链接 返回 表单 页 面 去 更 新 他 /她 填写 的 数据 。 新 的 表单 页 面 只 有 当 它 包含 了 用 
户 先 前 输入 的 信息 时 才 有 意义 。( 如 果 让 用 户 重复 输入 这 些 信息 会 很 令 人 泪 形 1!) 












































为 了 实现 这 一 点 ， 我 们 需要 把 当前 值 嵌 入 到 更 新 过 的 表单 中 。 在 第 27 fr, 我们 给 name 新 增 了 





$— 一 * 一 
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一 个 值 。 这 个 值 如 果 给 出 的 话 ， 会 被 插入 到 name 字段 。 显 然 地 ， 在 初始 表单 页 面 上 它 将 是 空 值 。 第 
38-41 行 ， 我 们 根据 当前 选 定 的 朋友 数目 设置 了 单 选 按 包 。 最 后 ， 通 过 第 49 行 和 52-55 行 更 新 了 的 
doResults O 函数 ， 我 们 创建 了 这 个 包含 已 有 信息 的 链接 ， 它 会 让 用 户 “ 返 回 ” 到 我 们 更 改 后 的 表单 
页 面 。 





62 行 

最 后 我 们 从 美学 角度 上 加 了 一 个 简单 的 特性 。 在 friendsl.py 和 friends2. py 的 截屏 中 ， 可 以 
看 到 返回 结果 和 用 户 的 输入 一 字 不 差 。 在 上 述 的 截屏 中 ， 如 果 用 户 的 名 字 没 有 大 写 这 将 影响 返回 的 
页 面 。 我 们 加 了 一 个 对 string. capwords () 函数 的 调用 从 而 自动 的 将 用 户 名 置 成 大 写 。capwords () 
函数 可 以 将 传 进来 的 每 个 单词 的 第 一 个 字母 置 成 大 写 的 。 这 也 许 是 或 许 不 是 必要 的 特性 ， 但 是 我 们 
还 是 愿意 一 起 分 享 它 ， 以 便 你 知道 这 个 功能 的 存在 。 

















下 边 我 们 将 会 展示 四 个 截屏 ， 表 明 用 户 和 CGI 表单 及 脚本 的 交互 过 程 。 


在 第 一 个 截屏 图 20 一 9 中 ,我 们 调用 friends3. py 生成 了 一 个 熟悉 的 新 表单 页 面 。 输 入 “fool bar, ” 


同时 故意 态 记 检查 单 选 按 钮 。 单 击 Submit 按钮 后 将 会 返回 错误 页 面 ， 请 看 第 二 个 截屏 图 20-10. 


S66 . friends CCI Demo 1 à 0. à a 
© © © © 4 & [© rnocinoscso00cgi-bin/friendss py 
4? Bookmarks 
Friends list for: NEW USER 








Your Name: foo bar 
How many friends do you have? © 0 © 10 © 25 O 50 © 100 
f Submit Query ) 





Document: Done Q7 
20 - 9 





图 20-9friends 的 初始 表单 页 面 在 MacOS X 操作 系统 Camino 浏览 器 上 的 显示 Cfriends3. py) 





aa + 
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IN 
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ee 
T | 


9660 ..  .—  HlendsCGiDem 1 OO 
© © © Q B Æ [O htep://locathost:8000/cgi-bin/friends3. py] 
4 Bookmarks 
ERROR 


mil 








Please select number of friends. 


Document: Done Q7 
20 - 10 





20-10 Friends 的 错误 页 面 〈 无 效 的 用 户 输入 ) 在 Camino 浏览 器 上 的 显示 CFriends3. py) 


我 们 单 击 “ 后 退 ” 按 钮 ， 选 择 “50” 单 选 按钮 ， 重 新 提交 表单 。 结 果 页 面 如 图 20-11， 也 非常 像 ， 
但 是 现在 在 页 面 底 部 有 个 额外 的 连接 。 这 个 连接 将 会 把 我 们 带 到 表单 页 面 。 新 表单 页 面 和 最 初 的 页 
面 的 唯一 区 别 是 所 有 用 户 输入 的 数据 都 被 设置 成 了 “默认 值 ” 这 意味 着 这 些 值 在 表单 中 已 经 存在 了 。 
我 们 可 以 看 图 20-12. 

















这 时 用 户 可 以 更 改 任何 一 个 字段 或 者 重新 提交 表单 。 





毫 无 疑问 你 会 开始 注意 到 我 们 的 表单 和 数据 已 经 变 得 复杂 多 了 ， 生 成 的 HTML 页 面 是 这 样 ， 结 果 
页 面 更 是 复杂 。 如 果 你 有 HM 文本 和 应 用 程序 的 接 入 点 的 话 ， 你 可 能 会 考虑 与 Python 的 HTMLgen 
模块 的 连接 ，HTMLgen 是 Python 的 一 个 扩展 模块 ， 专 用 于 生成 HTML. 页 面 。 











O08 .—. Friends CGI Demo 日 
© © © Q Q æ [O mp: localhost:8000/cgi-bin/friends3.py. 
4 Bookmarks 
Friends list for: Foo Bar 


Your Name: Foo Bar 
How many friends do you have? © 0 © 10 O 25 & 50 O 100 
f Submit Query ) 


Document: Done Q7 
20-11 





20-11 带 有 当前 信息 的 更 新 后 的 friends 表单 页 面 





aa + 


Edit By Vheavens 


Edit By Vheavens 


ee 
T 











eoo Friends CGI Demo C 
& Ww © Q A; Æ © http://localhost:8000/cgi-bin/friends3.py 
47 Bookmarks 
Friends list for: Foo Bar 
Your name is: Foo Bar 
You have 50 friends. 
Click here to edit your data again. 
Document: Done Q7 


图 20 - 12 








图 20-12 friends 结果 页 面 〈 无 效 输 入 ) (friends3. py) 
20.6 Æ CGI 中 使 用 Unicode 编码 


在 第 六 章 “ 序 列 ” 中 ， 我 们 介绍 了 Unicode 字符 串 的 使 用 。 在 6. 8. 5 部 分 ， 我 们 给 了 个 简单 的 
例子 脚本 :取得 Unicode 字 符 串 , 写 入 一 个 文件 ,并 重新 读 出 来 .在 这 里 ,我 们 将 演示 一 个 具有 Unicode 
输出 的 简单 CGI 脚本 ， 并 给 浏览 器 足够 的 提示 ， 从 而 可 以 正确 的 生成 这 些 字符 。。 

唯一 的 要 求 是 你 的 计算 机 必须 装 有 对 应 的 东亚 字体 以 便 浏 览 器 可 以 显示 它们 。 











为 了 看 到 Unicode 的 作用 ， 我 们 将 会 用 CGI 脚本 生成 一 个 多 语言 功能 的 Web 页 面 。 首 先 我 们 用 
Unicode 字符 串 定义 一 些 消 息 。 我 们 假设 你 的 编辑 器 只 能 输入 ASCII 编码 。 因 此 ， 非 ASCII 编码 的 字 
符 使 用 \u 转 义 符 输入 。 实 际 上 从 文件 或 数据 库 中 也 能 读 取 这 些 消息 。 











# Greeting in English, Spanish, 

# Chinese and Japanese. UNICODE HELLO = u^^^ Hello! 
\uO0ALHola! 

|u4F60 |u597D! 


|u3053 |u3093 |u306B |u3061 |u306F! 


ff ff ff 


CGI 产生 的 第 一 个 头 信息 指出 内 容 类 型 (content-type) 是 HITP。 此 处 还 声明 了 消息 是 以 UTF-8 
编码 进行 传输 的 ， 这 点 很 重要 ， 这 样 浏览 器 才 可 以 正确 的 翻译 它 。 


print 'Content-type: text/html; charset-UIF-8|r' 
print '|r' 





$ 
aa +e 
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例 20.7 简单 Unicode CGI 示例 CuniCGI. py) 
这 个 脚本 输出 到 你 Web 浏览 器 端的 是 Unicode 字符 串 。 








7 #!/fusr/bin/env python 

2 

3 CODEC = 'UTF-8' 

4 UNICODE HELLO = u’’’ 

5 Hello! 

6 lu00AIHola! 

7 |u4F60|u597D! 

8 |u3053|u3093 |u306B |u3061 |u306F! 

g?” 

10 

11 print ‘Content-Type: text/html; charset=%s\r’ % CODEC 
12 print ’\r’ 

13 print °’<HTML><HEAD<TITLE>Unicode CGI Demo /TITLES /HEADS” 
14 print '«BODY^' 

15 print UNICODE HELLO. encode (CODEC) 

16 print °’</BODY></HTML>’ 





然后 输出 真正 的 消息 。 事 先 用 string 类 的 encode 0) 方法 先 将 这 个 字符 串 转换 成 UTF-8 序列 。 


例 20.7 中 显示 了 完整 的 程序 。 
如 果 你 在 你 的 浏览 器 中 运行 这 个 CGI， 你 将 会 获得 如 图 20-13 所 示 的 输出 。 


File Edit View Go Bookmarks Tools Help 


Qa - a - 8S0 e | [| http://localhost:8000/cgi-bin/hello.py © co 























Hello! jHola! 你 好 ! ZAT br! 














20 - 13 





aa + 
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g 


20-13 简单 的 CGI Unicode 编码 在 Firefox 上 的 输出 (uniCGI. 人 


20.7 高 级 CGI 








现在 我 们 来 看 看 CGI 编程 的 高 级 方面 。 这 包括 cookie 的 使 用 〈 保 存在 客户 端的 缓存 数据 )， 同 
一 个 CGI 字段 的 多 重 值 ， 和 用 multipart 表单 实现 的 文件 上 传 。 为 了 节省 空间 ， 我 们 将 会 在 同一 个 
程序 中 向 你 展示 这 三 个 特性 。 首 先 让 我 们 看 下 多 次 提交 问题 。 








20.7.1 Mulitipart 表单 提交 和 文件 的 上 传 


目前 ，CGI 特别 指出 只 允许 两 种 表单 编码 ,“application/x-www-form-urlencoded " 和 
“multipart/form-dat” 由 于 前 者 是 默认 的 , 就 没有 必要 像 下 边 那 样 在 FORM 标签 里 声明 编码 方式 。 








<FORM enctype-/application/x-www-form-urlencoded^ ...> 














但 是 对 于 multipart 表单 ， 你 需要 像 这 样 明确 给 出 编码 : 


<FORM enctype=“multipart/ftorm-data” ...> 
在 表单 提交 时 你 可 以 使 用 任 一 种 编码 ， 但 在 目前 上 传 的 文件 仅 能 表现 为 multipart 编码 。 


Multipart 编码 是 由 网 景 在 早期 开发 的 ， 但 是 已 经 被 微软 《开始 于 LEA 版 ) 和 其 他 的 浏览 器 采用 。 








通过 使 用 输入 文件 类 型 完成 文件 上 传 : 


<INPUT type-file name=... > 








这 个 指令 表现 为 一 个 空 的 文本 字段 ， 同 时 旁边 有 个 按钮 ， 可 以 让 你 浏览 文件 目录 系统 ， 找 到 
要 上 传 的 文件 。 在 使 用 multipart 编码 时 ， 你 客户 端 提交 到 服务 器 端的 表单 看 起 来 会 很 像 带 有 附件 
的 email。 同 时 还 需要 有 一 个 单独 的 编码 ， 因 为 它 还 没有 聪明 到 “通过 URL 编码 ”的 程度 ， 尤 其 是 对 
一 个 二 进 制 文件 。 这 些 信息 仍然 会 到 达 服 务 器 ， 只 是 以 一 种 不 同 的 “封装 ”形式 而 已 。 



































不 论 你 使 用 的 是 默认 编码 还 是 multipart 编码 ，cgi 模块 都 会 以 同样 的 方式 来 处 理 它们 ， 在 表单 
提交 时 提供 键 和 相应 的 值 。 你 还 可 以 像 以 前 那样 通过 FieldStorage 实例 来 访问 数据 。 











20.7.2 多 值 字 段 








除了 上 传 文件 ， 我 们 将 会 展示 如 何 处 理 上 共有 多 值 的 字段 。 最 常见 的 情况 就 是 你 有 一 系列 的 复 选 
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框 允许 用 户 有 多 个 选择 。 每 个 复 选 框 都 会 标 上 相同 的 字段 名 ， 但 是 为 了 区 分 它们 ， 会 有 不 同 的 值 与 
特定 的 复 选 框 关联 。 








正如 你 所 知道 的 ， 在 表单 提交 时 ， 数 据 从 用 户 端 以 键 - 值 对 形式 发 送 到 服务 器 端 。 当 提交 不 止 一 
个 复 选 框 时 ， 就 会 有 多 个 值 对 应 同一 个 键 。 在 这 种 情况 下 ，cgi 模块 将 会 建立 一 个 这 类 实例 的 列表 ， 
你 可 以 凯 历 获得 所 有 的 值 ， 而 不 是 为 你 的 数据 指定 一 个 MiniFielStorage 实例 。 总 的 来 说 不 是 很 痛 
ie 

















20. 7.3 cookie 


最 后 ， 我 们 会 在 例子 中 使 用 cookie. WRX cookie 还 不 太 熟 悉 的 话 ， 可 以 把 它们 看 成 是 Web 
站 点 服务 器 要 求 保存 在 客户 端 〈 例 如 浏览 器 ) 上 的 二 进 制 数 据 。 











由 于 HTTP 是 一 个 “无 状态 信息 ”的 协议 ， 如 你 在 本 章 最 开始 看 到 的 截图 一 样 ， 是 通过 GET 请 
求 中 的 键 值 对 来 完成 信息 从 一 个 页 面 到 为 一 个 页 面 的 传递 。 实 现 这 个 功能 的 男 外 一 种 方法 如 我 们 以 
前 看 到 的 一 样 ， 是 使 用 隐藏 的 表单 字段 ， 如 在 后 期 friends. py 脚本 中 对 action 变量 的 处 理 。 这 些 
信息 必须 被 嵌入 新 生成 的 页 面 中 并 返回 给 客户 端 ， 所 以 这 些 变量 和 值 由 服务 器 来 管理 。 












































还 有 一 种 可 以 保持 对 多 个 页 面 浏览 连续 性 的 方法 就 是 在 客户 端 保存 这 些 数据 。 这 束 是 引进 
cookie 的 原因 。 服 务 器 可 以 向 客户 端 发 送 一 个 请 求 来 保存 cookie， 而 不 必用 在 返回 的 Web 页 面 中 
TRA BE TIER REAR. Cookie 连接 到 最 初 的 服务 器 的 主 域 上 (这 样 一 个 服务 器 就 不 能 设置 或 

者 覆盖 其 他 服务 器 上 的 cookie) ,并 且 有 一 定 的 生存 期 限 〈 因 此 你 的 浏览 器 不 会 堆 满 cookie). 














这 两 个 属性 是 通过 有 关 数 据 条 目的 键 - 值 对 和 cookie 联系 在 一 起 的 。cookie 还 有 一 些 其 他 的 属 
性 ， 如 域 子 路 径 ，cookie 安全 传输 请 求 。 














有 了 coockies， 我 们 不 再 需要 为 了 跟踪 用 户 而 将 数据 从 一 页 传 到 另 一 页 了 。 虽 然 这 在 隐私 问题 
上 也 引发 了 大 量 的 争论 ， 多 数 Web 站 点 还 是 合理 地 使 用 了 cookie。 为 了 准备 代码 ， 在 客户 端 获 得 请 
求 文件 前 ，Web 服务 器 向 客户 端 发 送 “SetCookie” 头 文件 要 求 客户 端 存储 cookie 























一 且 在 客户 端 建 立 了 cookie, HTTP_COOKIE 环境 变量 会 将 那些 cookie 自动 放 到 请 求 中 发 送 给 服 
务 器 。cookie 是 以 分 号 分 隔 的 键 值 对 存在 的 。 要 访问 这 些 数 据 ， 你 的 应 用 程序 就 要 多 次 拆 分 这 些 字 
符 串 (也 就 是 说 ， 使 用 str. split () 或 者 手动 解析 )。cookie 以 分 号 G) 分 隔 ， 每 个 键 - 值 对 中 间 都 


由 等 号 (=) 分 开 。 

















All multipart 编码 一 样 ，cookie 同样 起 源 于 网 景 ， 他 们 实现 了 cookie 并 制定 出 第 一 个 规范 并 党 
用 至 今 ， 在 下 边 的 Web 站 点 中 你 可 以 接触 这 些 文档 : 


http://www. netscape. com/newsref/std/cookie spec.html 
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—H cookie 标准 化 以 后 ， 这 些 文档 最 终 都 被 废除 了 ， 你 可 以 从 评论 请 求 文档 〈RFCs) 中 获得 更 
多 现在 的 信息 。 现 今 发 布 的 最 新 的 cookie 的 文件 是 RFC2109. 


20. 7.4 使 用 高 级 CGI 





现在 我 们 来 展示 CGI 应 用 程序 ， advcgi. py, 它 的 代码 号 功能 和 本 章 前 部 分 讲 到 的 friends3. py 
的 差别 不 是 很 大 。 默 认 的 第 一 页 是 用 户 填写 的 表单 ， 它 由 四 个 主要 部 分 组 成 : MAREA cookie 字符 
串 ， 姓 名 字段 ， 编 程 语言 复 选 框 列表 ， 文 件 提交 框 。 在 图 20-14 中 可 以 看 到 示 图 。 























20-15 是 在 另 一 个 浏览 器 看 到 的 表单 效果 图 ， 在 这 个 表单 中 ， 我 们 可 以 输入 自己 的 信息 ， 如 
图 20-16 中 给 的 样式 。 注 意 查找 文件 的 按钮 在 不 同 的 浏览 器 中 显示 的 文字 是 不 同 的 ,如 “Browse. ..”， 


“Choose”，“... ”等 。 











这 些 数据 以 mutipart 编码 提交 到 服务 器 端 ， 在 服务 器 端 以 同样 的 方式 用 FieldStorage 实例 获 
取 。 唯 一 不 同 的 就 是 对 上 传 文件 的 检索 。 在 我 们 的 应 用 程序 中 ,我 们 选择 的 是 逐 行 读 取 ,遍历 文件 。 
如 果 你 不 介意 文件 的 大 小 的 话 ， 也 可 以 一 次 读 入 整个 文件 。 


由 于 这 是 服务 器 端 第 一 次 接 到 数据 ， 这 时 ， 当 我 们 向 客户 端 返回 结果 页 面 时 ， 我 们 使 用 
“SetCookie:” 头 文件 来 捕获 浏览 器 端的 cookie. 
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eoo © Advanced CGI Demo c 
e * ? EG 


Refresh Home = AatoFil Print 





Advanced CGI Demo Form 
My Cookie Setting 
e CPPuser = (cookie has nct been set yet) 


Enter cookie value 
(optional) 


Enter your name 


| (required) 
What languages can you program in? (at least one required) 


M Python O PERL CJ Java C. C+ O PHP OC O JavaScript 








$ Enter file to upload E 
| f Browse... ) 
- 
E 
GB Loca mactine zone Z 
20-14 





20-14 上 传 及 多 值 表单 页 IE5 浏览 器 ， MacOS X 系统 





在 图 20-17 中 ， 你 可 以 看 到 数据 提交 后 的 结果 展示 。 用 户 输入 的 所 有 数据 都 可 以 在 页 面 中 显示 
出 来 。 在 最 后 对 话 框 中 指定 的 文件 也 被 上 传 到 了 服务 器 端 ， 并 显示 出 来 。 








你 也 会 注意 到 在 结果 页 面 下 方 的 那个 链接 ， 它 使 用 相同 的 CGI 脚本 ， 可 以 帮 有 我 们 返回 表单 页 。 





如 果 我 们 单 击 下 方 的 那个 链接 ， 没 有 任何 表单 数据 提交 给 我 们 的 脚本 ， 因 此 会 显示 一 个 表单 页 
面 。 然 而 ， 如 你 在 图 20-17 中 看 到 的 一 样 ， 所 有 的 东西 都 可 以 显示 出 来 ， 并 非 是 一 个 空 的 表单 ! 我 
们 前 边 输入 的 信息 都 被 显示 出 来 了 ! 在 没有 表单 数据 的 情况 下 我 们 是 怎样 做 到 这 一 点 的 呢 《〈 将 其 隐 
藏 或 者 作为 URL 中 的 请 求 参数 ) ? 实际 上 秘密 是 这 些 数据 都 被 保存 在 客户 端的 cookie 中 了 。 











用 户 的 cookie 将 用 户 输入 表单 中 的 值 都 保存 了 起 来 ， 用 户 名 ， 使 用 的 语言 ， 上 传 文件 的 信息 都 
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er 





会 存储 在 cookie 中 。 








当 脚 本 检测 到 表单 没有 数据 时 ， 它 会 返回 一 个 表单 页 面 ， 但 是 在 表单 页 面 建立 前 ， 它 们 从 客户 
端的 cookie 中 抓 取 了 数据 〈 当 用 户 在 单 击 了 那个 链接 的 时 候 将 会 自动 传 入 ) 并 且 相 应 的 将 其 填 入 表 
单 中 。 因 此 当 表 单 最 终 显示 出 来 时 ， 先 前 的 输入 便 会 魔术 般 的 显示 在 用 户 面 前 (图 20-18)。 





a [ud cg 


in/advcgi.py | Gal 





图 20-15 





图 20-15 同一 个 高 级 CGI 在 Netscape4 浏览 器 ，Linux 系统 





我 们 相信 你 现在 已 经 迫不及待 的 想 看 下 这 个 程序 了 ， 详 见 例 子 20. 8. 


advcgi. py 和 我 们 本 章 前 部 分 提 到 的 CGI 脚本 friends3. py 相当 的 像 。 它 有 表单 页 、 结 果 页 、 
错误 页 可 以 返回 。 新 的 脚本 中 除了 有 所 有 的 高 级 CGI 特性 外 ， 我 们 还 在 脚本 中 增加 了 更 多 的 面向 对 
象 特征 : 用 类 和 方法 代替 了 一 系列 的 函数 。 我 们 页 面 的 HTML. 文本 对 我 们 的 类 来 说 都 是 静态 的 了 ， 这 





+ + 
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就 意味 着 它们 在 实例 中 都 是 以 常量 出 现 的 一 虽然 我 们 这 里 仅 有 一 个 实例 。 


,Advanced CGI Demo - Opera | | 口 | x! 
File Edit View Bookmarks Tools Help 


vow cy re K HS | httpillocalhost:B000/cgi-bin/ad'|--Document:--0.8.—.| v. 
Advanced CGI Demo Form 

My Cookie Setting 

e CPPuser = (cookie has not been set yet) 


Enter cookie value 
Oh look mom, a cookie (optional) 


, Enter your name 
steven alistair kirk (required) 


What languages can you program in? (at least one required) 


W Python | | PERL M Java| | C++ | | PHE M C | | JavaScript 





Enter file to upload 


"C:\comments. txt" Choose 





图 20 - 16 





20-16 高 级 CGI 提交 演示 Opera8 Win32 系统 
逐 行 解释 〈 以 块 划分 ) 


1-1 47 

普通 的 起 始 、 和 模块 导入 行 出 现在 这 里 。 唯 一 你 可 能 不 太 熟 悉 的 模块 是 cStringI0， 我 们 曾 在 第 
10 章 简单 讲解 过 它 并 在 例 20. 1 中 用 过 。cStringI0. StingI00 会 在 字符 串 上 创建 一 个 类 似 文件 的 对 
象 ， 所 以 访问 这 个 字符 串 与 打开 一 个 文件 并 使 用 文件 句柄 去 访问 数据 很 相似 。 








e 
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Opera 4.01 Unregistered version - [Advanced CGI Demo] 


[E] Ele Edit View Navigation Bookmarks E-mail News Window Help —.[&|x| 
14442808 ¢4°% pee BG 
Your Uploaded Data 

























Your cookie value is: Oh look mom, a cookie! 
Your name is: Steven Alistair Kirk 


You can program in the following languages: 


* Python 
* Java 
ec 


Your uploaded file... 
Name: Corunents txt 
Contents: 


COMMENTS 


Like most of its Unix shell and script language brethren, 
uses the pound sign/hash mark ( f ) to indicate the beginr 
a line of comment. You can also start a comment in the mi 
the line. Basically, anything after the '#!' through the 上 
the line will be ignored. 


Click here to return to form. 


PRS EA frtemecanosteyaaveiny SSCL gj 


20-17 








20-17 Results page generated and returned by the Web server in Opera4 on 
Win32 





9-12 fT 

在 声明 AdvCGI 2&2 JH, header 和 url CA) 变量 被 创建 出 来 ， 在 显示 所 有 不 同 页 面 的 方法 中 
会 用 到 这 些 变量 。 

14-80 行 





所 有 这 个 块 中 的 代码 都 是 用 来 创建 、 显 示 表 单 页 面 的 。 那 些 数 据 属性 都 是 不 言 自 明 的 。 








getCPPcookie () 取得 Web 客户 端 发 来 的 cookie 信息 , 而 showForm Q 校对 所 有 这 些 信息 并 把 表单 页 面 


返回 给 客户 端 。 
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Opera 4.01 Unregistered version - [Advanced CGI Demo] 


[=] Eile Edit View Mavigation Bookmarks E-mail News Window Help [mj x| 


1] l5 3 dBB8 ead bac GE 





Advanced CGI Demo Form 


My Cookie Setting 


* CPPuser = Oh look mom, a cookiel 
Enter cookie value 
Oh look mom, a cookie! | (optional 


Enter your name 


[Steven Alistair Kirk (required) 


What languages can you program in? (gt east one required) 
[V Python [7 PERL M Java [7 C++[7 PHP IV. C T7 JavaScript 


Enter file to upload 


[Comments.te 图 


Subrnil | 
ar (xl 以 frit: ilocalhostipyladyvegi.py "| [ 00% "| 


20-18 








20-18 Form page with data loaded from the Client cookie 


82-91 fT 
这 个 代码 块 负责 错误 页 面 。 


93-144 fT 
结果 页 面 的 生成 使 用 了 本 块 代码 。setCPPcookie O DERA P? 9m 73 d ATT BJ P. H FF 4 fih 
cookie, ifj doResults () 方 法 聚集 所 有 数据 并 把 输出 发 回 客 户 端 。 








Example 20.8 Advanced CGI Application (advcgi. py) 
这 个 脚本 有 一 个 处 理 所 有 事情 的 主 函 数 ，AdvCGI， 它 有 方法 显示 表单 、 错 误 或 结果 页 面 ， 同 时 
也 可 以 从 客户 端 (Web 浏览 器 ) 读 写 cookie. 


E e 
+- aa +e 
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1 #!/usr/bin/env python 
2 
3 from cgi import FieldStorage 





4 from os import environ 

5 from cStringlO import StringlO 

6 from urllib import quote, unquote 

7 from string import capwords, strip, split, join 

8 

9 class AdvCGI (object): 

10 

11 header = "Content-Type: text/html \n\n’ 

12 url = ’/py/advegi. py’ 

18 

14 formhtml = ’’’ <HTML>S<HEAD<TITLE> 

15 Advanced CGI Demo</TITLE></HEAD 

16 <BODY><H2>Advanced CGI Demo Form</H2 

17 <FORM METHOD=post ACTION="%s” ENCTYPE-^multipart/form-data^»^ 
18 <H3>My Cookie Setting</HD> 

19 «LI^ <CODES<B>CPPuser = %s</B></CODE> 

20 H3>Enter cookie value<Bk> 

21 <INPUT NAME-cookie value="%s”> (<Doptional</L>) HS) 
22 H3>Enter your name<BR> 

23 <INPUT NAME-person VALUE="%s”> (<Drequired</L>) </H2 
24 <H3>What languages can you program in? 

25 (“Dat least one requiredX/ I») /H3» 

26 %s 

27 diS^Enter file to upload</HD 

28 <INPUT TYPE=file NAME=upfile VALUE-^ s^ SIZE=45> 
29 <PO<INPUT TYPE-submi t> 

30 </FORI</BODY></HTML>’’”’ 

31 

32 langSet = (C Python’, 'PERL', 'Java', °Ctt’, ’ PHP’, 
33 °C’, 7 JavaScript’) 

34 langItem = | 

35 ’ <INPUT TYPE-checkbox NAME=lang VALUE-^ s^" s^ %s\n’ 
36 

37 def getCPPCookies (self): # read cookies from client 
38 if environ. has key( lHTIP COOKIE") : 

39 for eachCookie in map(strip, | 
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40 split(environí'HTIP COOKIE ], ';')): 

41 if len(eachCookie) > 6 and | 

42 eachCookie[:3[] == 'CPP': 

43 tag = eachCookie[3: 7] 

44 try: 

45 self. cookies[tag/ = | 

46 eval (unquote (eachCookie[8: J) ) 

47 except (NameError, SyntaxError): 

48 self. cookies[tag/ = | 

49 unquote (eachCookie[8:]) 

50 else: 

51 self. cookiesí' info’ /] = self. cookies['user'] = '' 
32 

53 If self. cookies['info'| /= '': 

54 self. who, langStr, self. fn = | 

55 split(self. cookies(' info! ], ':') 

56 self. langs = split(langStr, ','"J 

57 else: 

58 self. who = self.fn =” ’ 

59 self. langs = [’ Python’ J 

60 

61 def showForm(self): # show fill-out form 
62 self. getCPPCookies () 

63 langStr = '' 

64 for eachLang in AdvCGI. langSet: 

65 if eachLang in self. langs: 

66 langStr += AdvCGI. langItem % | 

67 (eachLang, ' CHECKED’, eachLang) 

68 else: 

69 langStr += AdvCGI. langItem % | 

/0 (eachLang, '', eachLang) 

71 

72 if not self. cookies. has key( user’) or | 

73 self. cookies[’user’] == °’: 

74 cookStatus = ’<I>(cookie has not been set yet) S/D 
75 userCook = '' 

76 else: 

77 userCook = cookStatus = self. cookies[’ user’ / 
78 

79 print AdvCGI. header + AdvCGI. formhtml % (AdvCGI. url, 
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80 cookStatus, userCook, self. who, langStr, self. fn) 
ó1 

82 errhtml = ''' <HTML><HEAD<TITLE> 

83 Advanced CGI Demo</TITLED</HEAD 

84 <BODY><H3>ERRORV/H3S> 

85 <B>%s</B><P> 

86 <FORID<INPUT TYPE-button VALUE=Back 

87 ONCLICK-^window. history. back Q ~></FORID 

88 </BODY></HTML>’’’ 

89 

90 def showError (self): 

91 print AdvCGI. header + AdvCGI. errhtml % (self. error) 
92 

93 reshtml = ''' <HTMLS<HEAD<TITLE> 

94 Advanced CGI Demo</TITLED</HEAD 

95 <BODY><H2 Your Uploaded Data</H2> 

96 <H3>VYour cookie value is: <B>%s</B></HD> 

97 «H3»Your name is: <B>%s</B></HD> 

98 <H3>You can program in the following languages:«/H3^ 
99 UL>%s</UL> 

100 «H3^Your uploaded file... <BR> 

101 Name: <D%s</D<BR> 

102 Contents: </HS> 

103 <PRE>%S</PRE> 

104 Click <A HREF="%s”><Bheres/B></A> to return to form. 
105 </BODY></HTML>’’’ 

106 

107 def setCPPCookies (self) :# tell client to store cookies 
108 for eachCookie in self. cookies. keys  : 

109 print 'Set-Cookie: CPP%s=%s,; path= % | 

110 (eachCookie, quote (self. cookiesleachCookie])) 

"E 

112 def doResults(selt):# display results page 

113 MAXBYTES — 1024 

114 langlist = '' 

115 for eachLang in self. langs: 

116 langlist = langlist + ’<LID%s<BR>’ % eachLang 

L17 

118 filedata = '' 

119 while len(filedata) < MAXBYTES:# read file chunks 
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120 data = self. fp. readline () 

121 if data == °’: break 

122 filedata += data 

128 else: # truncate If too long 

124 filedata += | 

125 °... BKD (file truncated due to size)</D</B>’ 
126 self. fp. close() 

127 if filedata == 3 

128 filedata = | 

129 «XD (file upload error or file not given)</D</B»’ 
130 filename = self. fn 

131 

132 if not self. cookies. has key( user’) or | 

133 self. cookies['user'] == '': 

134 cookStatus = 'XI^(cookie has not been set yet) S/D 
135 userCook = '' 

136 else: 

137 userCook = cookStatus = self. cookies[ 'user'] 
138 

139 self. cookies[’ info’ ] = join([self. who, | 

140 join(self. langs, ','), filename], ':') 

141 self. setCPPCookies () 

142 print AdvCGI. header + AdvCGI. reshtml % | 

143 (cookStatus, self. who, langlist, 

144 filename, filedata, AdvCGI. url) 

145 

146 def go(self): # determine which page to return 
147 self. cookies = [] 

148 self error = °’ 

149 form = FieldStorage () 

150 if form keysQ == []: 

151 self. showForm() 

152 return 

153 

154 if form. has key( person’): 

155 self. who = capwords (strip (form[’ person’ J. value)) 
156 if self. who == "': 

157 self. error = 'Your name is required. (blank)' 
158 else: 

159 self. error = 'Your name is required. (missing)’ 
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160 

161 if form has key( cookie’): 
162 self. cookies['user'] = unquote (strip (| 
163 form[’ cookie’ J. value)) 

164 else: 

165 self. cookies[’user’] = '' 

166 

167 self. langs = [] 

168 if form has key( lang’): 

169 langdata = form[’ lang’ J 

170 if type (langdata) == type([]): 
171 for eachLang in langdata: 





172 self. langs. append (eachLang. value) 


173 else: 

174 self. langs. append (langdata. value) 

175 else: 

176 self. error = 'At least one language required. ' 
177 


178 if form. has key(Cupfile'): 
179 upfile = form[^upfile^] 
180 self. fn - upfile.filename or '' 
181 if upfile. file: 
182 self. fp = upfile. file 
183 else: 
184 self. fp = StringIO( (no data) ') 
185 else: 
186 self. fp = StringIO( (no file)’) 
187 self. fn =" 
188 
189 if not self. error: 
190 self. doResults () 


191 else: 

192 self. showError () 

193 

194 if name ==’ main 





195 page = AdvCGI Q 
196 page. go) 





doResults (方法 收集 所 有 数据 并 把 输出 发 回 客户 端 。 
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146-196 íF 
脚本 一 开始 就 实例 化 了 一 个 AdvCGI 页 面 对 象 ,然后 调用 它 的 go 0 ZriEiE Wis eK, XURUT 
格 的 基于 过 程 编写 的 程序 不 同 。 go () 方 法 中 包含 读 取 所 有 新 到 的 数据 并 决定 显示 哪个 页 面 的 逻辑 。 




















如 果 没 有 给 出 名 字 或 选 定 语言 ， 错 误 页 面 将 会 被 显示 。 如 果 没 有 收 到 任何 输入 数据 ， 将 调用 
showForm () 方 法 来 输出 表单 ， 否 则 将 调用 doResults () 方 法 来 显示 结果 页 面 。 通 过 设置 self. error 
变量 可 以 创建 错误 页 面 ， 这 样 做 有 两 个 目的 。 它 不 但 可 以 让 你 把 错误 原因 设置 在 字符 串 里 ， 并 且 可 
以 作为 一 个 标记 表明 有 错误 发 生 。 如 果 该 变量 不 为 空 ， 用 户 将 会 被 导 同 到 错误 页 面 。 









































处 理 person 字段 (第 154-159 行 ) 的 方法 和 我 们 先前 看 到 的 一 样 ， 一 个 键 - 值 对 ， 然 而 ， 在 收 
集 语言 信息 时 却 需要 一 点 技巧 ， 原 因 是 我 们 必须 检查 一 个 (Mini) FieldStorage 对 象 或 一 个 该 对 象 
的 列表 。 我 们 将 使 用 熟悉 的 type 0 内 建 函 数 来 达到 目的 。 最 终 ， 我 们 会 有 一 个 单独 或 多 个 语言 名 的 
列表 ， 有 具体 依赖 于 用 户 的 选择 情况 。 























使 用 cookie( 第 161-165 行 ) 来 保管 数据 展示 了 如 何 利 用 它们 来 避免 使 用 任何 类 型 的 CGI 字段 。 
你 一 定 注 意 到 了 代码 里 包含 这 些 数据 的 地 方 没有 调用 CGI 处 理 , 这 意味 着 数据 并 非 来 自 FieldStorage 
对 象 。 这 些 数据 是 由 Web 客户 端 通过 每 一 次 请 求 和 从 cookie 取得 的 值 (包括 用 户 的 选择 结果 和 用 来 
填充 后 续 表 单 的 已 有 信息 ) 传 给 我 们 的 。 
































因为 showResults 0 方法 从 客户 那里 取得 了 新 的 收入 值 ， 所 以 它 负 责 设置 cookie， 通 过 调用 
setCPPcookie () > m showForm O 必须 读 出 cookie 中 的 值 才 能 用 表单 页 显示 用 户 的 当前 选项 。 这 通 E 
we getCPPcookie O 的 调用 实现 。 
最 后 ， 我 们 看 看 文件 上 传 处 理 《〈 第 178-187 行 )。 不 论 一 个 文件 是 否 已 经 上 传 ，FieldStorage 都 
^^ file 属性 中 获得 一 个 文件 句柄 。 在 第 180 行 ， 如 果 没 有 指明 文件 名 ， 那 么 我 们 只 须 把 它 设 成 空 
字符 串 。 如 果 访 问 过 value 属性 ,那么 文件 的 整个 内 容 都 会 被 放 到 value 里 。 还 有 一 个 更 好 的 做 法 ， 
你 可 以 去 访问 文件 指针 file 属性 并 且 可 以 每 次 只 读 一 行 或 者 其 他 更 慢 一 些 的 处 理 方法 。 












































在 我 们 的 例子 里 ， 文 件 上 传 只 是 用 户 提 交 过 程 的 一 部 分 ， 所 以 我 们 可 以 简单 的 把 文件 指针 传 给 
doResults 函数， 从 文件 中 抽取 数据 。 由 于 空间 限制 doResults () 将 只 显示 文件 的 最 前 1K 内容， 这 
也 表明 显示 一 个 4M 的 二 进 制 文件 是 不 需要 《或 未 必 有 效 / 有 用 ) 的 。 




















20.8 Web (HTTP) 服务 器 





到 现在 为 止 ， 我 们 已 经 讨论 了 如 何 使 用 Python 建立 Web 客户 端 并 用 CGI 请 求 处 理 帮 助 Web 服务 
器 执行 了 一 些 工 作 。 我 们 通过 第 20.2 和 20. 3 的 学 习 知 道 了 Python 可 以 用 来 建立 简单 和 复杂 的 Web 
客户 端 。 而 对 复杂 的 CGI 请 求 没 有 说 明 。 














然而 ， 我 们 在 这 章 的 焦点 是 探索 建立 Web 服务 器 。 如 果 说 Firefox, Mozilla, IE, Opera, 
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Netscape, AOL, Safari, Camino, Epiphany, Galeon 和 Lynx 浏览 器 是 最 流行 的 一 些 Web 客户 
端 ,那么 什么 是 最 常用 的 Web 服务 器 呢 ? 它们 就 是 Apache, Netscape IIS, thttpd, Zeus, 和 Zope. 
由 于 这 些 服务 器 都 远 远 超 过 了 你 的 应 用 程序 要 求 ， 这 里 我 们 使 用 Python 建立 简单 但 有 用 的 Web 服务 
$E. 

















20.8.1 FA Python 建立 Web 服务 器 

















由 于 已 经 打算 建立 这 样 的 一 个 应 用 程序 ， 你 很 自然 的 就 需要 创建 个 人 素材 ， 但 是 你 将 要 用 到 的 
所 有 的 基础 代码 都 在 Python 的 标准 库 中 。 要 建立 一 个 Web 服务 , 一 个 基本 的 服务 器 和 一 个 “处 理 器 ” 
是 必 备 的 。 























基础 的 (Web) 服务 器 是 一 个 必 备 的 模具 。 它 的 角色 是 在 客户 端 和 服务 器 端 完 成 必要 HTTP 交互 。 
在 BaseHTTPServer 模块 中 你 可 以 找到 一 个 名 叫 HTTPServer 的 服务 器 基本 类 。 























处 理 器 是 一 些 处 理 主要 “Web 服务 ”的 简单 软件 。 它 们 处理 客户 端的 请 求 ， 并 返回 适当 的 文件 ， 
静态 的 文本 或 者 由 CGI 生成 的 动态 文件 。 处 理 器 的 复杂 性 决定 了 你 的 Web 服务 器 的 复杂 程度 。 Python 
标准 库 提 供 了 三 种 不 同 的 处 理 器 。 
























































最 基本 ， 最 普通 的 是 vanilla 处 理 器 ， 被 命名 BaseHTTPResquestHandler， 这 个 可 以 在 基本 
Web 服务 器 的 BaseHTTPServer 模块 中 找到 。 除 了 获得 客户 端的 请 求 外 ， 不 再 执行 其 他 的 处 理工 作 ， 
因此 你 必须 自己 完成 它们 ， 这 样 就 导致 了 出 现 了 myhttpd. py 服务 的 出 现 。 








用 于 SimpleHTTPServer 模块 中 的。 SimpleHTTPRequestHandler ， a w 在 
BaseHTTPResquestHandler 基础 上 ， 直 接 执 行 标准 的 GET 和 HEAD 请 求 。 这 虽然 还 不 算 完 美 ， 但 已 经 
可 以 完成 一 些 简 单 的 功能 啦 。 











最 后 ， 我 们 来 看 下 用 于 CGIHTTPServer 模块 中 的 CGIHTTPRequestHandler 处 理 器 ， 它 可 以 获取 
SimpleHTTPRequestHandler 并 为 POST 请 求 提供 支持 。 它 可 以 调用 CGI 脚本 完成 请 求 处 理 过 程 ， 也 可 
以 将 生成 的 HTML. 脚本 返回 给 客户 端 。 



































这 三 个 模块 和 他 们 的 类 在 表 20. 6 中 有 描述 。 




















为 了 能 理解 在 SimpleHTTPServer 和 CGIHTTPServer 模块 中 的 其 他 高 级 处 理 器 如 何 工 作 的 ， 我 们 
将 对 BaseHTTPRequestHandler 实现 简单 的 GET 处 理 功 能 。 
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Table 20.6 Web Server Modules and Classes 


模块 描述 





BaseHTTPServer $t 











ft Xt AS Hy Web 服务 和 处 理 器 类 ， 分 别 是 HTTPServer 和 








BaseHTTPRequestHandler 





SimpleHTTPServer ”包含 执行 GET AKI HEAD iK HJ SimpleHTTPRequestHandler 类 





CGIHTTPServer 包含 处 理 POST 请 求 和 执行 CGICGIHTTPRequestHandler 类 





在 例子 20. 9 中 ， 我 们 展示 了 一 个 Web 服务 器 的 全 部 工作 代码 ， myhttpd. py. 





这 个 服务 的 子 类 BaseHTTPRequestHandler 只 包含 do_GET (方法 在 基础 服务 器 接 到 GET 请 求 时 被 


调用 。 


和 尝试 打开 客户 端 传 来 的 路 径 ， 如 果实 现 了 ， 将 会 返回 “OK” 状 态 〈200)， 并 转发 下 载 的 Web 页 


， 和 否则 将 会 返回 404 状态 。 


main () 函数 只 是 简单 的 将 Web 服务 器 类 实例 化 ， 然 后 局 动 它 进入 永 不 停息 的 服务 循环 ， 如 果 








遇 到 了 C 中 断 或 者 类 似 的 键 输入 则 会 将 其 关闭 。 如 果 你 可 以 访问 并 运行 这 个 服务 器 ， 你 就 会 发 现 它 


会 显示 出 一 些 类 似 这 样 的 登录 输出 : 


# myhttpd. py 


Welcome to the machine... Press C once or twice to quit 
localhost - - [26/Aug/2000 03:01:35] “GET /index. html HTTP/1. 0” 200 - 
localhost — - [26/Aug/2000 03:01:29] code 404, message File Not Found: /x. html localhost 
- — [26/Aug/2000 03:01:29] “GET /dummy. html HTTP/1. 0^ 404 - 
localhost - - [26/Aug/2000 03:02:03] "GET /hotlist. htm HTTP/1. 0° 200 - 


当然 ， 我 们 的 小 Web 服务 器 是 太 简 单 了 ， 它 甚至 不 能 处 理 普通 的 文本 文件 。 我 们 将 这 部 分 给 读 
者 ， 这 部 分 可 以 在 本 章 最 后 的 练习 题 中 找到 。 





正如 你 所 看 到 的 一 样 ， 建 立 一 个 Web 服务 器 并 在 纯 Python 脚本 中 运行 并 不 会 花 太 多 时 间 。 为 你 








的 特定 应 用 程序 定制 改进 处 型 
的 信息 。 








器 将 需要 做 更 多 事情 。 请 碍 看 本 部 分 的 相关 库 来 获得 更 多 模块 及 其 类 











Example 20.9 Simple Web Server (myhttpd. py) 


这 个 简单 的 Web 服务 器 可 以 读 取 GET 请 求 ， 获 取 Web WIH C. html 文件 ) 并 将 其 返回 给 客户 端 。 
它 通过 使 用 BaseHTTPServer 的 BaseHTTPRequestHandler 处 理 器 执行 do_GETO 方 法 来 处 理 GET 请 求 。 





[e— 
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7 #!//usr/bin/env python 
2 


3 from os import curdir, sep 





4 from BaseHTTPServer import | 
5 BaseHTTPRequestHandler, HTTPServer 
6 
7 class MyHandler (BaseHTTPRequestHanaler) : 
8 
9 def do GET (self): 
10 try: 
11 f = open(curdir + sep + self. path) 
12 self. send response (200) 
13 self. send header ( Content-type’, 
14 'text/html') 
15 self. end headers () 
16 self. wfile. write(f. read 0) 
17 f. close 0 
18 except IOError: 
19 self. send error (404, 
20 'File Not Found: %s’ % self. path) 
21 
22 def main(): 
28 try: 
24 server = HTIPServer(( ', 80), MyHandler) 
25 print "Welcome to the machine... ’, 
26 print 'Press C once or twice to quit.’ 
27 server. serve forever () 
28 except KeyboardInterrupt: 
29 print ' C received, shutting down server' 
30 server. socket. close () 





al 
32 if name = ' main 
33 main 0 


20. 9 相关 模块 











TEX 20.7 中 ， 我 们 列 出 了 对 Web 开发 有 用 的 模块 。 也 许 你 会 想 看 下 第 十 七 章 的 因特网 客户 端 编 
程 ， 还 有 第 二 十 三 章 的 Web 服务 部 分 的 模块 ， 这 些 对 Web 应 用 都 是 有 用 的 。 
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Table 20.7 Web 编程 相关 模块 








模块 / 包 描述 

Web 应 用 程序 

cgi Neve (CGI) 获取 数据 
cgitb® 处 理 CGI 返回 数据 














htmllib 解析 HTML 文件 时 用 的 旧 HTML 解析 器 ，HTMLParser 类 扩展 自 sgmllib. SGMLParser 
HTMLparser® 新 的 非 基 于 SGML 的 HTML. XHTML 解析 器 
htmlentitydefs HTML 普通 实体 定义 


























Cookie 用 于 HTTP 状态 管理 的 服务 器 端 cookie 

cookielib' HTTP 客户 端的 cookie 处 理 类 

webbrowser' 控制 器 : 疝 浏 览 器 加 载 Web 文档 

sgmllib 解析 简单 的 SGML 文件 

robotparser' 解析 robots. txt 文件 作 URL 的 “可 获得 性 ”分 析 
httpliba 用 来 创建 HTTP 客户 端 

XML 解析 

xmllib 原始 的 简单 XML 解析 器 〈 已 过 时 /不 推荐 使 用 ) 

xml" 含 许多 不 同 XML 特点 的 解析 器 〈 见 下 文 ) 


xml. sax’ 简单 的 适用 于 SAX2 的 XML (SAX) 解析 器 
xml. dom ”文本 对 象 模 型 (DOM) 的 XML 解析 器 
xml. etree" ” 树 型 的 XML 解析 器 ， 基 于 Elemnt flexible container TR 
xml. parsers. expat’ 非 验 证 型 Expat XML 解析 器 的 接口 
xmlrpclib' ”通过 HTTP 提供 XML 远程 过 程 调用 (RPC) 客户 端 





Table 20.7 Web 编程 相关 模块 〈 续 ) 














模块 / 包 描述 

XML 解析 

SimpleXMLRPCServer” Python XML-RPC 服务 器 的 基本 框架 

DocXMLRPCServer* 自 描述 XML-RPC 服务 器 的 框架 

Web 服务 器 

BaseHTTPServer 用 来 开发 Web 服务 器 的 抽象 类 

SimpleHTTPServer ”处 理 最 简单 的 HTTP 请 求 CHEAD H GET) 

CGIHTTPServer 不 但 能 像 SimpleHTTPServers 一 样 处 理 Web 文件 ， 还 能 处 理 CGI 请 求 

(HTTP POST) 

wsgire' Web 服务 器 和 Python Web 应 用 程序 间 的 标准 接口 

第 三 方 开 发 包 ( 非 标准 库 ) 

HTMLgen 协助 CGI 把 Python 对 象 转换 成 可 用 的 HTML 
http://starship. python. net/crew/friedrich/HTMLgen/ html/main. html 

BeautifulSoup HTML, XML 解析 器 及 转换 器 http://crummy. com/software/BeautifulSoup 

邮件 客户 端 协 议 





$— o9 
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poplib 用 来 创建 POP3 客户 端 

imaplib 用 来 创建 IMAP4 X P xg 

邮件 、MIME 处 理 及 数据 编码 格式 

email‘ 管理 e-mail 消息 的 工具 包 ， 包 括 MIME 和 其 它 基于 RFC2822 的 消息 
mailbox e-mail 消息 的 信箱 类 

mailcap 解析 mailcap 文件 ， 从 中 获得 MIME 应 用 授权 


Table 20.7 Web 编程 相关 模块 〈 续 ) 
模块 / 包 描述 
邮件 、MIME 处 理 及 数据 编码 格式 
mimetools ”提供 封装 MIME 编码 信息 的 功能 
mimetypes ”提供 和 MIME 类 型 相关 的 功能 
MimeWriter 生成 MIME 编码 的 多 种 文件 
multipart ”可 以 解析 多 种 MIME 编码 文件 
quopri 编 解 码 使 用 quoted-printable 规范 的 数据 
rfc822 解析 符合 RFC822 标准 的 e-mail 头 信息 
smtplib 用 来 创建 SMTP 简单 邮件 传输 协议 ) 客户 端 
base64 编 解 码 使 用 base64 标准 的 数据 
binascii 编 解码 使 用 base64、binhex、uu (模块 ) 格式 的 数据 























binhex 编 解 码 使 用 binhex4 标准 的 数据 
uu 编 解码 使 用 uuencode 格式 的 数据 
因特网 协议 
httplib' 用 来 创建 HTTP ZE PF ii 
ftplib 用 来 创建 FTP (File Transfer Protocol) 4 F im 


gopherlib 用 来 创建 Gopher 客户 端 
telnetlib 用 来 创建 Telnet 客户 端 
nntplib 用 来 创建 NNTP《〈 网 络 新 闻 传 输 协 议 [Usenet] ) 客户 端 








Python 1.6 中 新 增 。 
Python 2.0 中 新 
Python 2. 2 中 新 增 。 
Python 2. 2 中 新 增 。 
Python 2. 4 中 新 增 。 
Python 2.5 中 新 增 。 
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20.10 yJ 


20-1.  urllib 模块 及 文件 。 
请 修改 friends3.py 脚本 ， 把 名 字 和 相应 的 朋友 数量 存储 在 一 个 两 列 的 磁盘 文本 文件 中 ， 以 后 
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每 次 运行 脚本 都 添加 名 字 。 附 加 题 : 增加 一 些 代码 把 这 种 文件 的 内 容 转 储 到 Web WERE CA HTML 
格式 )。 附 加 题 : 增加 一 个 链接 ， 用 以 清空 文件 中 的 所 有 名 字 。 








20-2.  urllib 模块 。 编 写 一 个 程序 ， 它 接收 一 个 用 户 输入 的 URL《〈 可 以 是 一 个 Web 页 面 或 一 
个 FTP 文件 ， 例 如 ，http:// python. org 或 ftp://ftp. python. org/pub/python/README)， 然 后 下 
载 它 并 以 相同 的 文件 名 (如 果 你 的 系统 不 支持 也 可 以 把 它 改 成 和 原文 件 相 似 的 名 字 ) 存储 到 电脑 上 。 
Web 页 面 CHTTP) 应 保存 成 . htm 或 . html 文件 ， 而 FIP 文件 应 保持 其 扩展 名 。 


20-3. urllib 模块 。 重 写 例 11. 4 的 grabWeb. py 脚本 ， 它 会 下 载 一 个 Web 页 面 ， 并 显示 生成 
的 HTML 文件 的 第 一 个 和 最 后 一 个 非 空 白 行 ， 你 应 使 用 urlopen (来 代替 urlretrieve () 来 直接 处 理 
数据 (这 样 就 不 必 先 下 载 所 有 文件 再 处 理 它 了 )。 











20-4. URL 和 正则 表达 式 。 你 的 浏览 器 也 许 会 保存 你 最 喜欢 的 Web 站 点 的 URL， 以 “书签 ” 
式 的 HTML 文件 Mozilla 发 行 品 的 浏览 器 就 是 如 此 ) 或 者 以 “收藏 来 ”里 一 组 . URL 文件 CIE 既是 如 
此 ) 的 形式 保存 。 查 看 你 的 浏览 器 记录 “热门 链接 ”的 办 法 ， 并 定位 其 所 在 和 存储 方式 。 不 去 更 改 
任何 文件 ， 剔 除 对 应 Web 站 点 (如 果 给 定 了 的 话 ) 的 URL 和 名 字 ， 生 成 一 个 以 名 字 和 链接 作为 输出 
的 双 列 列表 ， 并 把 这 些 数据 保存 到 硬盘 文件 中 。 和 截取 站 点 名 和 URL， 确 保 每 一 行 的 输出 不 超过 80 个 


一 


子 付 。 




















20-5. URL, urllib 模块 、 异 常 、 己 编码 正则 表达 式 。 作 为 对 上 一 个 问题 的 延伸 ， 给 你 的 肢 
本 增加 代码 来 测试 你 所 喜欢 的 链接 。 记 录 下 无 效 链接 (及 其 名 字 )， 包 括 无 效 的 Web 站 点 和 已 经 被 
删除 的 Web 页 面 。 只 输出 并 在 磁盘 中 保存 依然 有 效 的 链接 。 








20-6. ”错误 检测 。friends3. py 脚本 在 没有 选择 任意 一 个 单 选 按钮 指定 好 友 的 数目 时 会 返回 
一 个 错误 提示 。 在 更 新 CGI 脚本 是 如 果 没 有 输入 名 字 【 例 如 空 字符 或 空白 ) 也 会 返回 一 个 错误 。 附 
加 题 : 目前 为 止 我 们 探讨 的 仅 是 服务 器 端的 错误 检测 。 探 索 JavaScript 编程 , 并 通过 创建 JavaScript 
代码 来 同时 检测 错误 ， 以 确保 这 些 错 误 在 到 达 服 务 器 前 被 终止 ， 这 样 便 实 现 了 客户 端 错误 检测 。 





























D 


下 面 的 问题 20-7 到 20-10 涉及 Web 服务 器 的 访问 日 志文 件 和 正则 表达 式 。Web 服务 器 (及 其 
理 员 ) 通常 需要 保存 访问 日 志文 件 (一 般 是 主 Web 的 server 文件 夹 里 的 logs/access log) 来 跟踪 
文件 请 求 。 一 段 时 间 之 后 ， 这 些 逐 渐变 大 的 文件 需要 被 保存 或 删节 。 为 什么 不 能 仅 保存 有 用 的 信息 
而 删除 这 些 文 件 来 节省 磁盘 空间 呢 ? 通 过 下 面 的 习题 ， 你 会 练习 正则 表达 式 和 如 何 使 用 它们 进行 归 
档 及 分 析 Web 服务 器 数据 。 








M 





























20-7. 计算 日 志文 件 中 有 多 少 种 请 求 (GET vs POST). 


20-8. ”计算 成 功 下 载 的 页 面 /数据 : 显示 所 有 返回 值 为 200 (OK[ 没 有 错误 发 生 ] ) 的 链接 ， 以 
及 每 个 链接 被 访问 的 次 数 。 





20-9. 计算 错误 : 显示 所 有 产生 错误 的 链接 (返回 值 为 400 或 500) 以 及 每 个 链接 被 访问 的 次 
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20-10. ”跟踪 IP 地 址 : 对 每 个 IP 地 址 ， 输 出 每 个 页 面 /数据 下 载 情 况 的 列表 ， 以 及 这 些 链 接 
被 访问 的 次 数 。 











20-11. fÆ CGI. X Web 站 点 创建 “评论 ”或 “反馈 ”页 面 。 由 表单 获得 用 户 反 馈 ， 在 脚本 
中 处 理 数据 ， 最 后 返回 一 个 “thank you” WH. 








20-12. 简单 CGI。 创 建 一 个 Web 客户 薄 。 接 受用 户 输入 的 名 字 、e-mail 地 址 、 日 志 ， 并 将 
其 保存 到 文件 中 《〈 自 定义 格式 )。 类 似 上 一 个 题 ， 返 回 一 个 “thanks for filling out a guestbooks 
entry” 页 面 。 同 时 再 给 用 户 提供 一 个 查看 客户 注 的 链接 。 




















20-13. Web 浏览 器 Cookie 和 Web 站 点 注册 。 更 改 你 对 习题 20-4 的 答案 。 你 现在 可 以 使 用 用 
户 名 -密码 信息 来 注册 Web 站 点 ， 而 不 必 只 用 人 简单 的 基于 文本 的 菜单 系统 。 附 加 题 : 想 办 法 让 自己 就 
悉 Web 浏览 器 cookie， 并 在 最 后 登录 成 功 后 将 会 话 保持 4 个 小 时 。 

















20-14. Web 客户 端 。 移 植 例 20.1 的 Web EHI crawler.py， 使 用 HTMLParser 模块 或 
BeautifulSoup 解析 系统 。 











20-15. ， 错误 处 理 。 当 一 个 CGI PAA RIN RETA? 如 何 用 cgitb 模块 提供 帮助 ? 











20-16. ”CGI、 文 件 升 级 、 及 Zip 文件 。 创 建 一 个 不 仅 能 保存 文件 到 服务 器 磁盘 ， 而 且 能 智 
能 解压 Zip 文件 《或 其 它 压缩 档 ) 到 同名 子 文 件 夹 的 CGI 应 用 程序 。 





20-17. Zope、Plone、TurboGears、 及 Django。 研 究 每 一 个 复杂 的 Web 开发 平台 并 分 别 创建 
一 个 简单 的 应 用 程序 。 








20-18. Web 数据库 应 用 程序 。 思 考 对 你 Web 数据 库 应 用 程序 支持 的 数据 库 构 架 。 对 于 多 用 户 
的 应 用 程序 ， 你 需要 支持 每 个 用 户 对 数据 库 的 全 部 内 容 的 访问 ， 但 每 个 人 可 能 分 别 输入 。 一 个 例子 
就 是 你 家 人 及 杀 属 的 “地 址 短 ” 每 个 成 员 成 功 登 录 后 , 显示 出 来 的 页 面 应 该 有 几 个 选项 add an entry, 
view my entry, update my entry, remove or delete my entry, /& view all entries (整个 数据 


FE). 
































20-19. 电子 商务 引擎。 使 用 你 在 习题 13-11 中 建立 的 类 ， 增 加 一 些 产品 清单 建立 一 个 电子 商 
务 Web 站 点 。 确 保 你 的 应 用 程序 支持 多 个 用 户 ， 机 器 每 个 用 户 的 注册 功能 。 

















20-20. FAK cgi 模块 相关 。 正 如 你 所 知道 的 ，cgi. FieldStorage 0 方法 返回 一 个 字典 类 
对 象 , 包括 提交 的 CGI 变量 的 键 值 对 。 你 可 以 使 用 这 个 对 象 的 keys (和 has_key0 〇 方法 ,在 Pythonl.5 
中 ，get 0 〇 方法 被 添加 到 字典 中 ， 用 它 可 以 返回 给 定 键 的 值 ， 当 键 不 存在 时 返回 一 个 默认 值 。 
FieldStorage 对 象 却 没 有 这 个 方法 。 让 我 们 依照 用 户 手 册 的 形式 : 


























$— 一 * 一 











Edit By Vheavens 


Edit By Vheavens 


ee 
T | 


form = cgi. FieldStorage () 
73 cgi. py 中 类 的 定义 添加 一 个 类 似 的 get 0 方法 (你 可 以 把 它 重 命名 为 mycgi. 
的 名 字 )， 以 便 能 像 下 面 这 样 操作 : 
if form. has key( who’): 
who = form[’ who’ J. value 


else: 











who = '(no name submitted)’ 
， 也 可 以 用 一 行 实现 ， 这 样 就 更 像 字 典 的 形式 了 : 


howmany = form. get C who’, '(no name submitted) ') 








t 


py 或 其 他 你 喜欢 


20-21. 高 级 Web 客户 端 。 在 20.7 中 的 myhttpd. py 代码 只 能 读 取 HTML. 文件 并 将 其 返回 到 客 
户 端 。 添 加 对 以 “. txt” 结 束 的 普通 的 文本 的 支持 。 确 保 返 回 正 确 的 “text/plain”deMIME 类 。 附 
加 题 : 添加 对 以 “. jpg” 及 “. jpeg” BRAY JPEG 文件 的 支持 ， 并 返回 “image/ jpeg” 的 MIME 类 型 。 











20-22. ”高 级 Web 客户 端 。 作 为 crawl. py 的 输入 的 URL 必须 是 以 “http://” 协 议 指示 符 开 
3E, BBW URL 必须 包含 一 个 反 斜 线 ， 例 如 : http:// www.prenhallprofessional.com/. 加 强 
crawl. py 的 功能 ， 允 许 用 户 只 输入 主机 名 (没有 协议 部 分 [确保 是 HTTP] )， 反 和 斜 线 是 可 选 的 。 例 如 : 

















www. prenhallprofessional. com 应 该 是 可 接受 的 输入 形式 。 


20-23. ”高 级 Web 客户 端 。 更 改 20.3 小 节 中 的 crawl. py 脚本 ， 让 它 也 下 载 “ftp:” 型 的 链 
Be. PUR mailto: ”都 会 被 crawl. py 忽略 ,增加 代码 确保 它 也 忽略 “telnet:”、“news:”、“gopher:”、 




















和 “about:” 型 的 链接 。 


20-24. 高 级 Web 客户 端 。20. 3 小 节 中 的 crawl. py 脚本 仅 从 相同 站 点 内 的 Web 页 面 中 找到 链 
接 ， 下载 了 .html 文件 ， 却 不 处 理 / 保 存 图 片 这 类 对 页 面 同样 有 意义 的 “文件 ” 对 于 那些 允许 URL. 缺 
DRMR R O 的 服务 器 ， 这 个 脚本 也 不 能 处 理 。 给 crawl. py 增添 两 个 类 来 解决 这 些 问 题 。 























一 个 是 urllib.FancyURLOpener 类 的 子 类 My404Url0pener ， 它 仅 包 含 一 个 方法 ， 





http error 404()， 用 该 方法 来 判断 收 到 的 404 错误 中 是 不 是 包含 缺少 末端 斜 线 的 








URL。 如 果 有 ， 它 





就 添加 斜 线 并 从 新 请 求 〈 仅 一 次 )。 如 果 仍 然 失 败 ， 才 返回 一 个 真正 的 404 错误 。 你 必须 用 该 类 的 一 


个 实例 来 设置 urllib._urlopener， 这 样 urllib 才能 使 用 它 。 





创建 另 一 个 类 LinkImageParser， 它 派生 自 htmllib. HTMLParser。 这 个 类 应 有 一 个 构造 器 用 来 





调用 基 类 的 构造 器 ， 并 且 初 始 化 一 个 列表 用 来 保存 从 Web 页 面 中 解析 出 的 图 








片 文件 。 应 重 写 





handle image() 方 法 ， 把 图 片 文件 名 添加 到 图 片 列表 中 (这 样 就 不 会 像 现在 的 基 类 方法 那样 丢弃 它 
们 了 )。 
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本 章 的 主题 是 如 何 通过 Python 访问 数据 库 。 前 面 我 们 已 经 了 解 了 简单 持久 存储 ， 但 是 在 更 多 场 
合 下 ， 我 们 的 应 用 程序 需要 的 是 一 个 功能 齐全 的 关系 型 数据 库 。 


21. 1 介绍 
21.1.1 持久 存储 E 
在 任何 的 应 用 程序 中 ， 都 需要 持久 存储 。 一 般 说 来 ， 有 三 种 基本 的 存储 机 制 : 文件 、 关 系 型 数 
据 库 或 其 它 的 一 些 变 种 ， 例 如 现 有 系统 的 API，O0RM、 文 件 管理 上 器、 电子 表格 、 配 置 文件 等 等 。 
在 前 面 的 章节 中 ， 我 们 研究 了 通过 基于 常规 文件 的 Python 和 DBM 接口 来 实现 持久 存储 ， 比 如 


*dbm, dbhas/bsddb 文件 ，shelve (pickle 和 DBM 的 结合 )， 这 些 接口 都 提供 了 类 似 字 典 的 对 象 接口 。 
本 章 的 主题 是 如 何在 中 大 型 项 目 中 使 用 关系 型 数据 库 . (对 这 些 项 目 而 言 ， 那 些 接 口 力不从心 ) 


ee 

































































21.1.2 基本 的 数据 库 操 作 和 SQL 语言 














在 深入 主题 之 前 ， 下 面 移 简单 介绍 一 下 基本 的 数据 库 概 念 和 结构 化 碍 询 语言 《SQL)。 如 果 你 有 
足够 的 经 验 ， 可 以 跳 过 ， 也 可 以 通过 阅读 正文 来 复习 一 下 . 




















底层 存储 

数据 库 的 底层 存储 通常 使 用 文件 系统 ， 它 可 以 是 普通 操作 系统 文件 、 专 用 操作 系统 文件 , 甚至 有 
可 能 是 磁盘 分 区 。 

用 户 界 面 
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大 部 分 的 数据 库 系统 会 提供 一 个 命令 行 工具 来 执行 SQL 命令 和 查询 ， 当 然 也 有 一 些 使 用 图 形 界 
面 的 漂 漂 亮 亮 的 客户 端 程序 来 干 同 样 的 事 。 




















数据 库 

关系 型 数据 库 管 理 系统 通常 通常 都 支持 多 个 数据 库 , 例如 销售 库 、 市 场 库 、 客户 文 持 库 等 等 ， 如 
果 你 使 用 的 关系 数据 库 管 理 系统 是 基于 服务 器 的 ， 这 些 数据 库 就 都 在 同一 台 服 务 器 上 (一 些 简单 的 
关系 型 数据 库 没 有 服务 器 ， 如 sqlite). 本 章 的 例子 中 ，MySQL 是 一 种 基于 服务 器 的 关系 数据 库 管 
理 系统 (只 要 服务 器 在 运行 ， 它 就 一 直 在 等 待 运行 指令 ) SQLite 和 Gadfly 则 是 另 一 种 轻 量 型 的 基 
于 文件 的 关系 数据 库 (它们 没有 服务 器 ) 。 





















































组 件 

你 可 以 将 数据 库存 储 想像 为 一 个 表格 ， 每 行 数据 都 有 一 个 或 多 个 字段 对 应 着 数据 库 中 的 列 ， 每 
个 表 每 个 列 及 其 数据 类 型 的 集合 构成 数据 库 结构 的 定义 ， 数 据 库 能 够 被 创建 ， 也 可 以 被 删除 ， 表 也 
一 样 ， 往 数据 库 里 增加 一 条 记录 称 为 插入 (inserting) 一 条 记录 ， 修 改 库 中 一 条 已 有 的 记录 则 称 
为 更 新 (updating)， 删 除 表 中 已 经 有 的 数据 行 称 为 删除 (deleting). 这 些 操作 通常 作为 数据 库 操 
作 命令 来 提交 ， 从 一 个 数据 库 中 请 求 符合 条 件 的 数据 称 为 查询 (querying)， 当 你 对 一 个 数据 库 进 行 
查询 时 ， 你 可 以 一 步 取 回 所 有 符合 条 件 的 数据 ， 也 可 以 循环 逐条 取出 每 一 行 ， 有 些 数据 库 使 用 游标 
的 概念 来 表示 SQL 命令 ， 查 询 ， 取 回 结果 集 等 等 












































SQL 
. 数据 库 命令 和 查询 操作 需要 通过 SQL 语句 来 执行 .不 是 所 有 的 数据 库 都 使 用 SQL， 但 所 有 主流 . 
的 关系 型 数据 库 都 使 用 SQL， 下 面 是 一 些 SQL 命令 的 例子 ， 绝 大 多 数 数 据 库 被 配置 为 大 小 写 不 敏感 ， 
除了 数据 库 操作 命令 以 外 .被 广 为 接 受 的 书写 SQL 的 基本 风格 是 关键 字 大 写 ， 绝 大 多 数 命 令 行 程 序 

要 求 用 一 个 分 号 来 结束 一 条 SQL 语句 . 























创建 数据 库 


CREATE DATABASE test; 
GRANT ALL ON test. * to user(s); 





第 一 行 创建 一 个 名 为 “test” 的 数据 库 ， 第 二 行将 该 数据 库 的 权限 赋 给 具体 的 用 户 (或 者 全 部 
用 户 )， 以 便 它们 可 以 执行 下 面 的 数据 库 操作 。 











选择 要 使 用 的 数据 库 

USE test; 

如 果 在 登录 数据 库 时 没有 指定 要 使 用 那个 数据 库 ， 这 条 简单 的 语句 就 可 以 指定 你 打算 访问 的 数 
据 库 . 











删除 数据 库 
DROP DATABASE test; 














Edit By Vheavens 


Edit By Vheavens 


ee 
T | 


这 条 短 短 的 语句 具有 极 大 的 威力 ， 它 用 来 删除 数据 库 (包括 数据 库 中 所 有 的 表 及 表 中 的 数据 ). 
在 输入 完 这 条 语句 按 下 回 车 之 前 ， 好 好 想 想 你 是 否 真 的 打算 这 么 做 . 




















创建 表 

CREATE TABLE users (login VARCHAR(S), uid INT, prid INT); 

这 个 语句 用 于 创建 表 users， 它 有 一 个 类 型 为 字符 串 的 列 login 和 两 个 类 型 为 整数 的 字段 uid 
和 prid。 








删除 表 
DROP TABLE users; 
这 个 简单 的 语句 删除 数据 库 中 的 一 个 表 和 它 的 所 有 数据 。 





插入 行 

INSERT INTO users VALUES( leanna’, 311, D); 

INSERT 语句 用 来 向 数据 库 中 添加 新 的 数据 行 ， 语句 中 必须 指定 要 插入 的 表 及 该 表 中 各 个 字段 的 
值 。 上 例 中 ， 表 名 是 users, RFR’ leana 对 应 着 login 字段 ，311 和 1 分 别 对 应 着 uid 和 
prid. 


更 新 行 
UPDATE users SET prid-4 WHERE prid-2; 
UPDATE users SET prid-1 WHERE uid=311; 


UPDATE 语句 用 来 改变 数据 库 中 的 已 有 记录 . 使 用 SET 关键 字 来 指定 你 要 修改 的 字段 及 新 值 ， 
你 可 以 指定 条 件 来 筛选 出 需要 更 新 的 记录 . 在 第 一 个 例子 中 ， 所 有 prid 字段 值 为 2 的 记录 ， 其 
prid 字段 的 值 都 变更 为 4 在 第 二 个 例子 里 ，uid 字段 值 为 311 的 用 户 ， 其 prid 字段 的 新 值 被 
置 为 1. 















































删除 行 

DELETE FROM users WHERE prid=%d; 

DELETE FROM users; 

DELETE FROM 命令 用 来 删除 数据 ， 必 须 指 定 你 要 删除 的 数据 所 在 表 名 ， 如 果 未 提供 Xem n 
选 条 件 ， 就 象 第 二 个 例子 一 样 ， 表 中 所 有 的 数据 都 会 被 删除 . 











现在 你 已 经 了 解数 据 库 的 基本 概念 ， 有 了 这 些 基础 ， 本 章 余 下 的 部 分 学 起 来 会 更 加 容易 ， 如 果 
需要 进一步 了 解数 据 库 知识 ， 市 面 是 有 数 不 清 的 数据 库 书 籍 可 以 选择 ， 




















21.1.3 数据库 和 Python 








F 面 我 们 要 详细 了 解 Python 数据 库 APT. Python 能 够 直接 通过 数据 库 接口 ， 也 可 以 通过 ORM 
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(不 需要 自己 书写 SQL) 来 访问 关系 数据 库 . 





类 似 数据 库 原理 ， 并 发 能 力 ， 视 图 ， 原 子 性 ， 数 据 完整 性 ， 数 据 可 恢复 性 ， 还 有 左 连接 ， 触 发 
器 ， 查 询 优化 ， 事 务 文 持 ， 及 存储 过 程 等 等 ， 这 些 东 西 ， (市 面 上 ) 有数 不 清 的 资源 可 供 参 考 . 本 章 
不 讨论 这 些 主题 ， 我 们 将 从 一 个 python 应 用 程序 开始 ， 了 解 在 python 框架 下 如 何 将 数据 保存 到 
数据 库 ， 如 果 将 数据 从 数据 库 中 取出 来 .之 后 你 就 可 以 决定 哪 种 方式 适用 于 你 手头 的 项 目 ， 通 过 学 
习 示 例 代 码 ， 你 可 以 立马 动手 把 茶 种 数据 库 整合 到 你 的 python 应 用 程序 当中 . 

















在 python 世界 里 ， 无 需 怀 疑 ， 与 数据 库 协 同 工 作 已 经 是 几乎 所 有 应 用 程序 的 核心 部 分 .在 本 
章 中 ， 我 们 将 不 仅仅 使 用 ”万 能 “的 Python 标准 库 . 尽管 我 们 需要 从 标准 库 开 始 . 








作为 一 个 软件 工程 师 ， 在 你 的 职业 生涯 中 ， 你 可 能 永远 不 需要 学 习 数 据 库 知 识 : 如 何 使 用 命令 
行 工具 ， 如 何 使 用 SQL? 如 何 添加 和 更 新 数据 ?等 等 等 等 。 如 果 python 是 你 的 编程 工具 ， 为 你 的 
python 应 用 添加 数据 库 文 持 易如反掌 下面 我 们 先 来 介绍 一 下 Python DB-API， 然 后 给 出 使 用 这 个 
标准 的 例子 . 





我 们 的 例子 会 使 用 开源 的 数据 库 系统 ， 不 过 我 们 不 会 去 讨论 开源 产品 好 还 是 商业 产品 更 好 .要 
适应 其 它 的 数据 库 也 相当 容易 ， 需 要 特别 提 到 的 是 Aaron Watter 的 Gadfly 数据 库 ， 一 个 完全 由 
Python 代码 写成 的 数据 库 系 统 . 





从 python 中 访问 数据 库 需 要 接口 程序 .接口 程序 是 一 个 python 模块 ， 它 提供 数据 库 客户 端 
库 (通常 是 C 语言 写成 的 ) 的 接口 供 你 访问 .需要 提 到 一 点 ， 所 有 Python 接口 程序 都 一 定 程度 上 遵 
^Y Python DB-API 规范 ， 这 也 是 本 章 的 第 一 个 主要 主题 . 








21.1 演绎 了 Python 数据 库 应 用 程序 的 结构 (包括 使 用 和 不 使 用 ORM). 你 可 以 看 到 DB-API 
是 数据 库 客 户 端 C 库 的 接口 . 


Application 
(embedded SQL) 














图 21-1 数据 库 和 应 用 程序 之 间 的 多 层 通讯 . 第 一 个 盒子 一 般 是 C/C++ 程序 ， 你 的 程序 通过 
DB-API 兼容 接口 程序 访问 数据 库 . ORM 通过 程序 处 理 数 据 库 细节 来 简化 数据 库 开 发 . 
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21.2 Python 数据 库 应 用 程序 
程序 员 接 口 (DB-API) 
去 哪儿 找 一 个 合适 的 接口 访问 数据 库 ? 很 简单 ， 去 python. org 找到 数据 库 主 题 那 一 节 ， 你 会 


发 现 所 有 支持 DB-API 2.0 的 各 种 数据 库 模 块 ， 文 档 ，SIG 等 等 ， 从 那 时 起 ，DB-API 被 移 到 PEP 249 
中 (这 个 PEP 废弃 了 老 的 DB-API 1.0 ， 也 就 是 PEP248 标准 )， 那么 ， 什 么 是 DB-API ? 





DB-API 是 一 个 规范 。 它 定义 了 一 系列 必须 的 对 象 和 数据 库存 取 方式 ， 以 便 为 各 种 各 样 的 底层 数 
据 库 系统 和 多 种 多 样 的 数据 库 接口 程序 提供 一 致 的 访问 接口 ， 象 绝 大 多 数 社 区 成 果 一 样 ， 这 个 API 
的 产生 来 自 于 强烈 的 需求 . 




















在 “ 旧 社 会 ， 不 同 的 人 为 各 种 各 样 的 数据 库 实现 了 各 种 各 样 的 数据 库 接口 程序 ， 同 一 个 轮子 被 
不 同 的 人 一 遍 又 一 遍 的 重复 发 明 ， 这 些 接口 由 不 同 的 人 在 不 同 的 时 间 实现 ， 功 能 接口 各 不 兼容 ， 这 
意味 着 使 用 这 些 接口 的 程序 必须 自 定义 他 们 选择 的 接口 模块 ， 当 这 个 接口 模块 变化 时 ， 应 用 程序 的 
代码 也 必须 随 之 更 新 . 

















一 个 处 理 Python 数据 库 事 务 的 特殊 事物 小 组 CSIG, special interest group) 因此 诞生 ， 
最 后 . DB-API 1.0 问世 ，DB-API 为 不 同 的 数据 库 提供 了 一 致 的 访问 接口 ， 在 不 同 的 数据 库 之 间 移 








植 代码 成 为 一 件 轻 松 的 事情 (一般 来 说 ， 只 修 要 修改 几 行 代码 )， 接 下 来 你 会 看 到 这 样 的 例子 . 





21. 2. 1 模块 属性 


DB-API 规范 里 的 以 下 特性 和 属性 必须 提供 ， 一 个 DB-API 兼容 的 模块 必须 定义 下 表 Table 21.1 














中 定义 的 所 有 全 局 属性 . 
数据 属性 
apilevel 





apilevel 这 个 字符 串 (不 是 浮 点 数 ) 表示 这 个 DB-API 模块 所 兼容 的 DB-API 最 高 版 本 号 ， 如 果 
“1.0”，“2.0”， 如 果 未 定义 ， 则 默认 是 “1. 0”; 








表 21.1 DB-API 模块 属性 




















属性 名 描述 

apilevel DB-API 模块 兼容 的 DB-API 版 本 号 
threadsafety 线程 安全 级 别 

paramstyle 该 模块 支持 的 SQL 语句 参数 风格 
connect () 连接 函数 





异常 (参见 表 21. 4) 
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threadsafety 
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threadsafety 这 是 一 个 整数 ， 取 值 范 围 如 下 
e 0: 不 支持 线程 安全 ， 多 个 线程 不 能 共享 此 模块 


1: 初 级 线程 安全 支持 : 线程 可 以 共享 模块 ， 但 不 能 共享 连接 





e 
e 2: 中 级 线程 安全 支持 线程 可 以 共享 模块 和 连接 ， 但 不 能 共享 游标 
e 3: 完 全 线程 安全 支持 线程 可 以 共享 模块 ， 连 接 及 游标 . 














如 果 一 个 资源 被 共享 ， 就 必需 使 用 自 旋 锁 或 者 是 信号 量 这 样 的 同步 原 语 对 其 进行 原子 目标 锁定 。 








对 这 个 目标 来 说 ， 磁盘 文件 和 全 局 变量 都 不 可 靠 ， 并 且 有 可 能 妨碍 . 
mutex CH. E58) 的 操作 .参阅 threading 模块 或 第 16 章 (多 线程 编程 ) 来 了 解 如 何 使 用 锁 . 


paramstyle 


DB-API 支持 多 种 方式 的 SQL 参数 风格 ， 这 个 参数 是 一 个 字符 串 ， 表 明 SQL 语句 中 字符 串 蔡 代 的 
方式 ， (参阅 表 21. 2) 


函数 属性 


connect 方法 生成 一 个 connect 对 象 ， 我 们 通过 这 个 对 象 来 访问 数据 库 ， 符合 标准 的 模块 都 
会 实现 connect 方法 ， 表 21.3 列 出 了 connect 函数 的 参数 . 





表 21. 2 数据库 参数 风格 


Parameter 
风格 


数字 
命名 


pyformat 


问号 


format 


描述 el 

数字 位 置 风格 WHERE name=:1 

命名 参数 风格 WHERE name-:name 
python 字典 格式 转换 WHERE name-$ (name) s 
问号 风格 WHERE name-? 

标准 ANSI C 格式 转换 WHERE name-&s 











数据 库 连 接 参数 可 以 以 一 个 DSN 字符 串 的 形式 提供 ， 也 可 以 以 多 个 位 置 相关 参数 的 形式 提供 
(如 果 你 明确 知道 参数 的 顺序 的 话 )， 也 可 以 以 关键 字 参 数 的 形式 提供 ， 下 面 是 一 个 来 自 PEP 249 的 
使 用 connect O. 的 例子 : 

connect (dsn-' myhost:MYDB', user-' guido’, password=" 2346" ) 





使 用 DSN 字符 





中 
rH 











还 是 独立 参数 ?这 要 看 你 连接 的 是 哪 种 数据 库 . 举例 来 说 ， 如 果 你 使 用 类 似 





IN 


一 * 一 —4- 
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ODBC 或 JDBC AY API， 你 就 应 该 使 用 DSN 字符 串 . 如 果 你 直接 访问 数据 库 ， 你 就 会 更 倾 问 于 使 用 
独立 参数 ， 另 一 个 使 用 独立 参数 的 原因 是 ， 很 多 数据 库 接口 程序 还 不 文 持 DSN 参数 . 下面 是 一 个 
非 DSN 的 例子 . 


K 21.3 connect. KA 属性 





























参数 描述 

user Username 
password Password 

host Hostname 
database Database name 
dsn Data source name 








connect (0) 调用. 注意 不 是 所 有 的 接口 程序 都 是 严格 按照 规范 实现 的 . MySQLdb 就 使 用 了 db 参 
数 而 不 是 规范 推荐 的 database 参数 来 表示 要 访问 的 数据 库 . 
€ MySQLdb. connect (host=’ dbserv’, db-'inv', user? smith') 








€ PgSQL. connect (database-' sales') 

€ psycopg. connect (database-' templatel', user? pgsql’ ) 

€ gadfly. dbapi20. connect ( csrDB’, ’ /usr/local/database’ ) 
€ sqlite3. connect ( marketing/test’ ) 

异常 














兼容 标准 的 模块 也 应 该 提供 这 些 异 常 类 ， 见 表 21.4 





21. 2. 2 连接 对 象 





要 与 数据 库 进 行 通信 ， 必 须 先 和 数据 库 建 并 连接 .连接 对 象 处 理 命令 如 何 送 往 服 务 器 ， 以 及 如 
何 从 服务 器 接收 数据 等 基础 功能 .连接 成 功 (或 一 个 连接 池 ) 后 你 就 能 够 回 数据 库 服务 器 发 送 请 求 ， 












































得 到 响应 . 
表 21.4 DB-API 异常 类 
异常 描述 
Warning 警告 异常 基 类 
Error 错误 异常 基 类 
InterfaceError 数据 库 接 口 错误 
DatabaseError 数据 库 错 误 
DataError 理 数 据 时 出 错 
OperationalError 数据 库 执 行 命令 时 出 错 
IntegrityError 数据 完整 性 错误 


InternalError 数据 库 内 部 出 错 
ProgrammingError SQL 执行 失败 





$— 一 * 一 
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NotSupportedError ”试图 执行 数据 库 不 支持 的 特性 











方法 








连接 对 象 没 有 必须 定义 的 数据 属性 ， 但 是 它 至 少 应 该 定义 表 21.5 中 的 这 些 方法 . 

一 旦 执行 了 close) 方法 ， 再 试图 使 用 连接 对 象 的 方法 将 会 导致 异常 . 

对 不 支持 事务 的 数据 库 或 者 虽然 支持 事务 ， 但 设置 了 自动 提交 (auto-commit) 的 数据 库 系统 来 
说 ，commit (方法 什么 也 不 做 .如 果 你 确实 需要 ， 可 以 实现 一 个 自 定义 方法 来 关闭 自动 提交 行为 . 
由 于 DB-API 要 求 必 须 实 现 此 方法 ， 对 那些 没有 事务 概念 的 数据 库 来 说 ， 这 个 方法 只 需要 有 一 条 
pass 语句 就 可 以 了 . 

类 似 commit O0, rollbackO 方法 仅 对 支持 事务 的 数据 库 有 意义 .执行 完 rollback ()， 数 据 库 
将 恢复 到 提交 事务 前 的 状态 .根据 PEP249， 在 提交 commit 中 之 前 关闭 数据 库 连接 将 会 自动 调用 
rollback (0 〇 方法 . 







































































对 不 支持 游标 的 数据 库 来 说 ，cursor 0 方法 仍然 会 返回 一 个 尽量 模仿 游标 对 象 的 对 象 ， 这 些 是 
最 低 要 求 ， 特 定数 据 库 接口 程序 的 开发 者 可 以 任意 为 他 们 的 接口 程序 添加 额外 的 属性 ， 只 要 他 们 愿 


























èr 





DB-API 规范 建议 但 不 强制 接口 程序 的 开发 者 为 所 有 数据 库 接 口 模块 编写 异常 类 ， 如 果 没 有 提 
供 异 常 类 ， 则 假定 该 连接 对 象 会 引发 一 致 的 模块 级 异常 ， 一 旦 你 完成 了 数据 库 连 接 ， 并 且 关 闭 了 . 



































游标 对 象 ， 你 应 该 执行 commit () 提交 你 的 操作 ， 然 后 关闭 这 个 连接 . 








表 21.5 连接 对 象 方法 














Method Name Description 

close () 关闭 数据 库 连 接 

commi t () 提交 当前 事务 

rollback () 取消 当前 事务 

cursor () 使 用 这 个 连接 创建 并 返回 一 个 游标 或 类 游标 的 对 象 


errorhandler (cxn, cur, 
errcls, errval) 


21.2.3 游标 对 象 











当 你 建立 连接 之 后 ， 就 可 以 与 数据 库 进 行 交 互 ， 我 们 在 前 面 那 一 小 节 提 交 ， 一 个 游标 允许 用 户 
执行 数据 库 命令 和 得 到 查询 结果 .一 个 Python DB-API 游标 对 象 总 是 扮演 游标 的 角色 ， 无 论 数据 库 
是 否 真 正 支持 游标 .从 这 一 点 讲 ， 数 据 库 接口 程序 必须 实现 游标 对 象 ， 只 有 这 样 ， 才 能 保证 无 论 使 
用 何 种 后 端 数据 库 你 的 代码 都 不 需要 做 任何 改变 . 























创建 游标 对 象 之 后 ， 你 就 可 以 执行 查询 或 其 它 命令 (或 者 多 个 查询 和 多 个 命令 )， 也 可 以 从 结果 
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集中 取出 一 条 或 多 条 记录 ， 表 21.6 列举 了 游标 对 象 拥有 的 属性 和 方法 . 


























表 21.6 游标 对 象 的 属性 

对 象 属性 描述 

arraysize 使 用 fechmany () 方 法 一 次 取出 多 少 条 记录 ， 默 认 值 为 1 

connectionn 创建 此 游标 对 象 的 连接 (可 选 ) 

description 返回 游标 活动 状态 (一 个 包含 七 个 元 素 的 元 组 ): (name, type code, 


display size, internal size, precision, scale, null ok); 只 有 name 
和 type code 是 必须 提供 的 . 














lastrowid 返回 最 后 更 新 行 的 id (可 选 ) id， 默 认 返 回 None) 
rowcount 最 后 一 次 executeO 操作 返回 或 影响 的 行 数 . 

callproc(func[,args]) ”调用 一 个 存储 过 程 

close() 关闭 游标 对 象 


execute(opl,args]) ”执行 一 个 数据 库 查 询 或 命令 

executemany(op,args) 类似 execute() 和 mapO 的 结合 ， 为 给 定 的 每 一 个 参数 准备 并 执行 
一 个 数据 库 查 询 /命令 

表 21.6 游标 对 象 属性 CS) 

对 象 属性 描述 

fetchone () 得 到 结果 集 的 下 一 行 

fetchmany ([size-cursor. 

arraysize]) 得 到 结果 集 的 下 几 行 OL = size) 

fetchall () 返回 结果 集中 剩 下 的 所 有 行 

| iter Q 创建 一 个 迭代 对 象 ( 可 选 ， 参阅 next O) 
































messages 游标 执行 后 数据 库 返 回 的 信息 列表 (元 组 集合 ) (可 选 ) 

next () 使 用 迭代 对 象 得 到 结果 集 的 下 一 行 (可 选 ; 类 似 fetchoneO, Bh] _ iter 0) 
nextset () 移 到 下 一 个 结果 集 〈 如 果 文 持 的 话 ) 

rownumber 当前 结果 集中 游标 的 索引 (以 行为 单位 ， 从 0 开始 ) 〈 可 选 ) 


setinput- sizes(sizes) 设置 输入 最 大 值 〈 必 须 有 ， 但 具体 实现 是 可 选 的 ) 
setoutput- size(size[,col]) 设置 大 列 的 缓冲 区 大 写 (必须 有 ， 但 具体 实现 是 可 选 的 ) 














游标 对 象 最 重要 的 属性 是 execute* O 和 fetch*() 方法 . 所 有 对 数据 库 服务 器 的 请 求 都 由 它 
们 来 完成 . 对 fetchmany (方法 来 说 ， 设 置 一 个 合理 的 arraysize 属性 会 很 有 用 . 当然， 在 不 需要 时 
关 掉 游标 对 象 也 是 个 好 主意 .如 果 你 的 数据 库 支持 存储 过 程 ， 你 就 可 以 使 用 callproc 0 方法 . 





























21.2.4 类 型 对 象 和 构造 器 





通常 两 个 不 同系 统 的 接口 要 求 的 参数 类 型 是 不 一 致 的 , 譬如 python 调用 c 函数 时 Python 对 象 和 
C 类 型 之 间 就 需要 数据 格式 的 转换 ， 反 之 亦 然 ， 类 似 的 ， 在 Python 对 象 和 原生 数据 库 对 象 之 间 也 是 
如 此 .对 于 Python DB-API 的 开发 者 来 说 ， 你 传递 给 数据 库 的 参数 是 字符 串 形式 的 ， 但 数据 库 会 根 
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据 需要 将 它 转换 为 多 种 不 同 的 形式 ， 以 确保 每 次 查询 能 被 正确 执行 . 








举例 来 说 ， 一 个 Python 字符 串 可 能 被 转换 为 一 个 VARCHAR， 或 一 个 TEXT， 或 一 个 BLOB， 或 一 
个 原生 BINARY 对 象 ， 或 一 个 DATE BK TIME 对象 ， 一 个 字符 串 到 底 会 被 转换 成 什么 类 型 ? 必须 小 心 
的 尽 可 能 以 数据 库 期 望 的 数据 类 型 来 提供 输入 ， 因 此 另 一 个 DB-API 的 需求 是 创建 一 个 构造 器 以 生成 
特殊 的 对 象 ， 以 便 能 够 方便 的 将 Python 对 象 转换 为 合适 的 数据 库 对 象 . K 21. 7 描述 了 可 以 用 于 此 
目的 的 类 .SQL 的 NULL 值 被 映射 为 Pyhton 的 NULL 对 象 ， 也 就 是 None. 




















表 21.7 类 型 对 象 和 构造 器 

类 型 对 象 描述 

Date (yr, mo, dy) 日 期 值 对 象 

Time (hr, min, sec) ”时 间 值 对 象 

Timestamp (yr, mo, dy, 

hr, min, sec) 时 间 惟 对 象 

DateFromTicks(ticks) 通过 自 1970-01-01 00:00:01 utc 以 来 的 ticks 秒 数 得 到 日 期 
TimeFromTicks (ticks) 通过 自 1970-01-01 00:00:01 utc 以 来 的 ticks 秒 数 得 到 时 间 值 对 象 
TimestampFromTicks(ticks) 通过 自 1970-01-01 00:00:01 utc 以 来 的 ticks 秒 数 得 到 时 间 戳 

















对 象 
Binary (string) ”对 应 二 进 制 长 字符 串 值 的 对 象 
STRING 描述 字符 串 列 的 对 象 ， 比 如 VARCHAR 
BINARY 描述 二 进 制 长 列 的 对 象 比如 RAW, BLOB 
NUMBER 描述 数字 列 的 对 象 
DATETIME 描述 日 期 时 间 列 的 对 象 
ROWID 描述 “row ID" 列 的 对 象 





DB-API 版 本 变更 





有 几 个 重要 的 变更 发 生 在 DB-API 从 1.0(1996) 升级 到 2. 0(1999) 时 : 
@ 从 API 中 移 除 了 原来 必须 的 dbi 模块 
更 新 了 类 型 对 象 

增加 了 新 的 属性 以 提供 更 易 用 的 数据 库 绑 定 
变更 了 callprocO 的 语义 及 重 定义 了 execute) 的 返回 值 
基于 异常 的 错误 处 理 





























自从 DB-API 2.0 发 布 以 来 ， 曾 经 在 2002 年 加 入 了 一 些 可 选 的 DB- API 扩展 ， 但 一 直 没 有 什么 
重大 的 变更 . 在 DB-SIG 邮件 列表 中 一 直 在 讨论 DB-API 的 未 来 版 本 -- 暂时 命名 为 DB-API 3.0. 它 
将 包括 以 下 特性 : 








当 有 一 个 新 的 结果 集 时 nextset () 会 有 一 个 更 合适 的 返回 值 
@ float 变更 为 Decimal 
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支持 更 灵活 的 参数 风格 
预备 语句 或 语句 缓存 

优化 事务 模型 

确定 DB-API 可 移 值 性 的 角色 
增加 单元 测试 
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如 果 你 对 这 些 APT 特别 感 兴趣 ， 欢 迎 积极 参与 ， 下 面 有 一 些 手 边 的 资源 . 
€ http://python. org/topics/database 

€ http://www. linuxjournal. com/article/2605 

€ http://wiki. python. org/moin/DbApi3 





21.2.5 关系 数据 库 





现在 我 们 准备 开始 ， 一 个 问题 摆 在 面前 ， 在 Pyhton 里 我 可 以 使 用 哪 种 数据 库 接口 ? 换言之 ， 
Python 支持 哪些 平台 ? 答案 是 几乎 所 有 的 平台 .下 面 是 一 个 不 怎么 完整 的 数据 库 支 持 列 表 : 








商业 关系 数据 库 管理 系统 








Informix 
Sybase 

Oracle 

MS SQL Server 
DB/2 

SAP 

Interbase 


Ingres 








开源 关系 数据 库 管 理 系统 
€ MySQL 

€ PostgreSQL 
e SQLite 

€ Gadfly 





数据 库 APIs 
e JDBC 
e ODBC 


E 
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要 知道 Python 支持 哪些 数据 库 ， 请 参阅 下 面 网 址 : 








http://python. org/topics/database/modules. html 


21. 2.6 数据 库 和 Python: 接口 程序 


对 每 一 种 支持 的 数据 库 ， 都 有 一 个 或 多 个 Python 接口 程序 允许 你 连接 到 目标 数据 库 系 统 ， 某 些 
数据 库 ， 比 如 Sybase, SAP, Oracle 和 SQLServer， 都 有 两 个 或 更 多 个 接口 程序 可 供 选 择 ， 你 要 做 
的 就 是 挑选 一 个 最 能 满足 你 需求 的 接口 程序 .你 挑选 接口 程序 的 标准 可 以 是 : 性 能 如 何 ? 文档 或 
WEB 站 点 的 质量 如 何 ? 是 否 有 一 个 活跃 的 用 户 或 开发 社区 ? 接口 程序 的 质量 和 稳定 性 如 何 ? 等 等 等 
等 ， 记 住 绝 大 多 数 接口 程序 只 提供 基本 的 连接 功能 ， 你 可 能 需要 一 些 额外 的 特性 ， 高 级 应 用 代码 如 
线程 和 线程 管理 以 及 数据 库 连 接 池 的 管理 等 等 ， 需 要 你 自己 来 完成 . 

























































































如 果 你 不 想 处 理 这 些 ， 比 方 你 不 喜欢 自己 写 SQL， 也 不 想 参 与 数据 库 管 理 的 细节 一 那么 本 章 后 
面 讲 到 的 ORM 应 该 可 以 满足 你 的 要 求 . 现在 来 看 一 些 使 用 接口 程序 访问 数据 库 的 例子 ， 关 键 之 处 在 
于 设置 数据 库 连 接 . 在 建立 连接 之 后 ， 不 管 后 端 是 何 种 数据 库 ， 对 DB-API 对 象 的 属性 和 方法 进行 
操作 都 是 一 样 的 . 



































21.2.7 使 用 数据 库 接口 程序 举例 * 











首先 ， 我 们 来 看 一 下 例子 代码 ， 创 建 数据 库 ， 创 建 表 ， 使 用 表 .， 我 们 分 别提 供 了 使 用 MySQL, 
PostgreSQL，SQLite 的 例子 . 











MySQL 


这 里 我 们 以 MySQL 数据 库 为 例 ， 使 用 唯一 的 MySQL 接口 程序 : MySQLdb， 这 个 接口 程序 又 名 
MySQL-python. 在 这 部 分 代码 里 ， 我 们 故意 在 例子 里 理 下 一 个 错误 

首先 我 们 以 管理 员 身 份 登录 ， 创 建 一 个 数据 库 ， 并 赋予 相应 权限 ， 之 后 我 们 再 以 普通 用 户 身 份 
登录 数据 库 ， 以 便 你 能 了 解 你 希望 得 到 什么 ， 这 样 你 会 想到 为 它 创 建 一 个 事件 处 理 程序 . 












































222 import MySQLdb 

22^ cxn = MySQLdb. connect (user-' root’) 

>> cxn. query ( DROP DATABASE test’) Traceback (most recent call last): 

File “stdin, line l, in ? 

_mysql_exceptions. OperationalError: (1008, “Can’t drop database ‘test’; database 
doesn't exist”) 

222 cxn. query ( CREATE DATABASE test’) 
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222^ cxn. query (GRANT ALL ON test. * to ''&' localhost’ ^) 
22^ cxn. commi t () 
222 cxn. close () 





在 上 面 的 代码 中 ， 我 们 没有 使 用 cursor 对 象 。 某 些 (但 不 是 所 有 的 ) 接口 程序 拥有 连接 对 象 ， 
这 些 连 接 对 象 拥 有 query (0 方法 ， 可 以 执行 SQL 查询 。 我 们 建议 你 不 要 使 用 这 个 方法 ， 或 者 事先 检 
查 该 方法 在 当前 接口 程序 当中 是 否 可 用 。 之 后 我 们 以 普通 用 户 身 份 再 次 连接 这 个 新 数据 ， 创建 表 ， 
然后 通过 Python 执行 SQL 查询 和 命令 ， 来 完成 我 们 的 工作 。 这 次 我 们 使 用 游标 对 象 (cursors) 和 它 
们 的 execute 0 〇 方法， 下 一 个 交互 集 演示 了 创建 表 。 





















































下 面 的 代码 演示 了 如 何 创建 一 个 表 .， 在 删除 一 个 表 之 前 如 果 试 图 重建 这 个 表 将 产生 错误 . 


22^ cxn = MySQLdb. connect (db-' test’) 

222 cur = cxn. cursor () 

22» cur. execute( CREATE TABLE users (login VARCHAR(S), uid INT)’) 
OL 


现在 我 们 来 插入 几 行 数据 到 数据 库 ， 然 后 再 将 它们 取出 来 . 





222 cur. execute (“INSERT INTO users VALUES ( john’, 7000) ^) 

IL 

>> cur. execute (“INSERT INTO users VALUES ( jane’, 7001) ^) 
IL 

222 cur. execute (“INSERT INTO users VALUES C bob’, 7200) ?) 

IL 
222^ cur. execute (“SELECT x FROM users WHERE login LIKE ° j% ^) 
AL 
2 for data in cur. fetchall(): 

print °%s\t%s’ % data 


John /000 
Jane /001 





最 后 一 个 特性 是 更 新 表 ， 包 括 更 新 或 删除 数据 . 


222» cur. execute (UPDATE users SET uid-7100 WHERE uid-7001^) 
IL 

22» cur. execute (“SELECT * FROM users”) 

3L 

222^ for data in cur. fetchall(): 





$— 一 * 一 
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print °%s\t%s’ % data 





John /000 


Jane /100 

bob /200 

222» cur. execute ( DELETE FROM users WHERE login-/bob^') 
IL 

>»» cur. execute ( DROP TABLE users’) 

OL 


222 cur. close Q 
222 cxn. commi t () 
222 cxn. close Q) 


Mysql ERMITA E. SECRET MySQL 的 Python 接口 程序 .不 过 
Python 标准 库 中 并 没有 集成 这 个 接口 程序 ， 这 是 一 个 第 三 方 包 ， 你 需要 单独 下 载 并 安装 它 ， 在 本 章 
的 末尾 的 索引 页 ， 你 可 以 找到 如 何 下 载 它 . 














PostgreSQL 


另 一 个 著名 的 开源 数据 库 是 PostgreSQL. 5 MySQL 不 同 ， 有 至 少 3 个 Python 接口 程序 可 

以 访问 PosgreSQL: psycopg, PyPgSQL 和 PyGreSQL， 第 四 个 ,PoPy， 现 在 已 经 被 废弃 (2003 F, € 

贡献 出 自己 的 代码 ， 与 PygreSQL 整合 在 一 起 )， 这 三 个 接口 程序 各 有 长 处 ， 各 有 缺点 ， 根 据 实 践 结 
果 选 择 使 用 哪个 接口 是 个 好 主意 . 























多 亏 他 们 都 支持 DB-API， 所 以 他 们 的 接口 基本 一 致 ， 你 只 需要 写 一 个 应 用 程序 ， 然 后 分 别 测 
试 这 三 个 接口 的 性 能 (如 果 性 能 对 你 的 程序 很 重要 的 化 ). 下面 我 给 出 这 三 个 接口 的 连接 代码 : 
psycopg 











22^ import psycopg 
22^ cxn = psycopg. connect (user-' pgsql1') 


PyPgSQL 


222 from pyPgSQL import PgSQL 
22^ cxn = PgSQL. connect (user-' pgsql') 


PyGreSQL 


222 import pgdb 
22^ cxn = pgdb. connect (user-' pgsql’) 





$— 一 * 一 
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好 ， 下 面 的 代码 就 能 够 在 所 有 接口 程序 下 工作 了 . 











222 cur = cxn. cursor () 

22^ cur. execute (C SELECT x FROM pg database’) 
2^» rows = cur. fetchall() 

222 for i in rows: 

oe print i 

222 cur. close () 

222 cxn. commi t () 

>> cxn. close () 


最 后 ， 你 会 发 现 他 们 的 输出 有 一 点 点 轻微 的 不 同 . 


sales 
templatel 
template0 


psycopg 


(sales’, 1, 0, O, 1, 17140, ° 140626’, ° 8221366099’, 
"^ None, None) 

(templatel’, 1, 0, 1l, L 17140, '462', '462/', "', None, 
" lpgsqi-C*T*/pgsql) ') 

( templated’, 1, 0, 1, 0, 17140, '462', '462/', "', None, 


' lpgsq1-C*T*/pgsql] ') 
PyGreSQL 


[’sales’, 1, 0, False, True, 17140L, ’ 140626’, 
3221366099’, "', None, None/ 

[’templatel’, 1, 0, True, True, 17140L, '462/', ° 462’, 
'", None, 'tpgsql-C*T*/pgsql) ' ] 

[’templateO’, l1, 0, True, False, 17140L, '462', 

'462', '"', None, '[ípgsqli-C*T*/pgsgl) ' / 


SQLite 
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对 非常 简单 的 应 用 来 说 ， 使 用 文件 进行 持久 存储 通常 就 足够 了 ， 但 对 于 绝 大 多 数 数据 驱动 的 应 
用 程序 必须 使 用 全 功能 的 关系 数据 库 . SQLite 介 于 二 者 之 间 ， 它 定位 于 中 小 规模 的 应 用 . 它 是 相当 
轻 量 级 的 全 功能 关系 型 数据 库 ， 速 度 很 快 ， 几 乎 不 用 配置 ， 并 且 不 需要 服务 器 . 




















SQLite 正在 快速 的 流行 ， 并 且 在 各 个 平台 上 都 能 用 . 在 python2.5 集成 了 前 面 介 绍 的 
pysqlite 数据 库 接口 程序 ， 作 为 python2.5 的 sqlite3 模块 .这 是 Python 标准 库 第 一 次 将 一 个 
数据 库 接口 程序 纳入 标准 库 ， 也 许 这 标志 着 一 个 新 的 开始 . 








它 被 打包 到 Python 当中 并 不 是 因为 他 比 其 它 的 数据 库 接口 程序 更 优秀 ， 而 是 因为 他 足够 简单 ， 
使 用 文件 (或 内 存 ) 作为 它 的 后 端 存储 ， 就 象 DBM 模块 做 的 那样 ， 不 需要 服务 器 ， 而 且 也 不 存在 授 
权 问 题 ， 它 是 Python 中 其 它 的 持久 存储 解决 方案 的 一 个 替代 品 ， 一 个 拥有 SQL 访问 界面 的 优秀 蔡 
代 品 ， 在 标准 库 中 有 这 么 一 个 模块 ， 融 能 方便 用 户 使 用 Python 和 SQLite 进行 软件 开发 ， 等 到 软 
件 产 品 正 式 上 市 发 布 时 ， 只 要 需要 ， 就 能 够 很 容易 的 将 产品 使 用 的 数据 库 后 端 变更 为 一 个 全 功能 的 ， 
更 强大 的 类 似 MySQL, PostgreSQL, Oracle 或 SQL Server 那样 的 数据 库 ， 当 然 ， 对 那些 不 需要 那 
么 大 马力 的 应 用 程序 来 说 ，SQLite 已 经 足够 使 用 . :) 
































尽管 标准 库 已 经 提供 了 数据 库 接口 程序 ， 你 仍然 需要 自己 下 载 真正 的 数据 库 软 件 . (作者 好 像 此 
处 犯 糊涂 了 .sqlite 是 不 需要 额外 下 载 东西 的 ， 只 要 有 接口 程序 就 可 以 工作 ). 一 旦 你 安装 好 之 后 ， 
你 只 需要 打开 Python 解释 器 ， 下 面 是 一 个 例子 : 


>>> import sqlite3 E 
22)» cxn = sqlite’. connect ( sqlite_test/test’) 
222^ cur = cxn. cursor Q) 
>> cur. execute ( CREATE TABLE users (login VARCHAR(S), uid 
INTEGER)’ ) 
>> cur. execute ( INSERT INTO users VALUES (^ john^, 100)’ ) 
222 cur. execute ( INSERT INTO users VALUES (jane, 110)’ ) 
22» cur. execute ( SELECT * FROM users’) 
2» for eachUser in cur. fetchall(): 
print eachUser 























(u’ john’, 100) 

(u’ jane’, 110) 

>> cur. execute ( DROP TABLE users’) 
<sqlite’. Cursor object at Ox3d432) 
222 cur. close () 

222 cxn. commit () 

222 cxn. close () 


OK， 这 个 小 例子 已 经 足够 了 ， 接 下 来 ， 我 们 来 看 一 个 小 程序 ， 它 类 似 前 面 使 用 MySQL 的 例子 ， 
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不 过 更 简单 一 些 . 


创建 数据 库 《〈 如 果 成 功 ) 
创建 表 
从 表 中 增加 行 
从 表 中 修改 行 
从 表 中 删除 行 
删除 表 











对 这 个 例子 来 说 中 ， 我 们 仍然 使 用 两 个 其 它 的 开源 数据 库 . SQLite 现 如 今 已 经 相当 流行 ， 它 体 
积 小 ， 而 且 足 够 快 ， 是 一 个 几乎 拥有 全 部 功能 的 相当 轻 量 级 的 数据 库 . 这 个 例子 中 用 到 的 另 一 个 数 
据 库 是 Gadfly， 一 个 基本 兼容 SQL 的 纯 Python 写成 的 关系 数据 库 . 〈 某 些 关键 的 数据 库 结 构 有 一 
个 C 模块 ， 不 过 Gadfly 没有 它 也 一 样 可 以 运行 [当然 ， 会 慢 不 少 ， 嘿 嘿 ]). 

















在 进入 代码 之 前 ， 有 几 个 提醒 . SQLite 和 Gadfly 需要 用 户 指 定 保存 数据 库 文件 的 位 置 Mysal 
有 一 个 默认 区 域 保存 数据 ， 在 使 用 Mysql 数据 库 时 无 需 指 定 这 个 )， A Gadfly 目前 的 版 本 还 不 
兼容 DB-API 2.0， 也 就 是 说 ， 它 缺失 一 些 功能 ， 尤 其 是 缺少 我 们 例子 中 用 到 的 cursor 属性 


rowcount. 


数据 库 接口 程序 应 用 程序 举例 * 
在 下 面 这 个 例子 里 ， 我 们 演示 了 Python 如 何 访问 数据 库 ， 事 实 上 ， 我 们 的 程序 支持 三 种 不 


同 的 数据 库 系 统 : Gadfly, SQLite 和 MySQL. 我 们 将 要 创建 一 个 数据 库 (如 果 它 不 存在 的 话 ).， 然后 
进行 多 种 数据 库 操作 ， 比 如 创建 表 ， 删 除 表 ， 插 入 数据 ， 更 新 数据 ， 删 除数 据 等 等 . 
在 下 一 小 节 中 的 ORM 中 我 们 将 重复 例子 21. 1 的 这 些 功 能 . 
































逐 行 解释 


第 1-18 行 

脚本 的 第 一 部 分 导入 必须 的 模块 ， 创 建 一 些 ” 全 局 常量 ”( 列 的 显示 大 小 及 我 们 的 程序 支持 的 数 
HE). 其 中 setup) 函数 ， 提 供 一 个 简单 界面 让 用 户 选 择 使 用 哪 种 数据 库 . 

值得 留意 的 是 DB EXC 常量 ， 它 代表 数据 库 异 常 ， 他 最 终 的 值 由 用 户 最 终 选 择 使 用 的 数据 库 
决定 ， 也 就 是 说 ， 如 果 用 户 选 择 MySQL, DB EXC 将 是 mysql_exceptions， 以 此 类 推 ... 如果 我 们 
用 流行 的 面向 对 象 的 方式 来 开发 这 个 应 用 ， 它 将 会 以 一 个 实例 属性 的 方式 表示 ， 比 如 
self.db exc module 或 者 什么 别 的 名 字 . 





























第 20-75 行 
表现 数据 库存 取 一 致 性 本 质 的 connect O 函数 在 这 一 段 ， 在 每 一 小 节 的 开头 ， 我 们 尝试 载 入 需 
要 的 数据 库 模块 ， 如 果 找 不 到 合适 的 模块 ，None 值 被 返回 ， 表 示 这 个 数据 库 系统 暂 不 支持 . 





$ 
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在 数据 库 连 接 建立 以 后 ， 其 余 的 代码 对 数据 库 和 接口 程序 来 说 都 是 透明 的 (不 区 分 哪 种 数据 库 ， 
哪 种 接口 程序 ， 代 码 都 可 以 工作 )， 有 一 个 唯一 的 例外 ， 就 是 脚本 的 insert 0 函数. 在 所 有 三 个 
小 节 的 这 段 代码 里 ， 数 据 库 连 接 成 功 后 会 返回 一 个 连接 对 象 cxn. 




















如 果 选 中 了 SQLite(24 行 -36 行 )， 我 们 尝试 载 入 一 个 数据 库 接口 程序 ， 我 们 首先 尝试 载 入 标准 
库 模块 sqlite3(Python2.5 及 更 高 版 本 文 持 )， 如 果 载 入 失败 ， 就 会 去 寻找 第 三 方 pysqlite2 包 . 
这 个 包 支 持 Python 2.4. x 或 更 老 些 的 系统 . 














如 果 成 功 导 入 合适 的 接口 程序 ， 由 于 SQLite 是 基于 文件 的 数据 库 系统 , 同 我 们 需要 确认 一 下 数 
据 库 文 件 所 在 的 目录 是 否 存 在 . (当然 ， 你 也 可 以 选择 在 内 存 里 创建 一 个 数据 库 ).， 当 调用 connect O 
函数 时 ， 如 果 这 个 数据 库 文件 已 经 存在 ，SQLite 会 使 用 这 个 数据 库 ， 如 果 文 件 不 存 ， 它 就 会 创建 一 
个 新 文件 . 











例子 21. 1 数据 库 接口 程序 示例 
这 段 脚 本 使 用 同样 的 接口 对 多 种 数据 库 执行 了 一 些 数 据 库 基 本 操作 . 


7 #!//usr/bin/env python 
2 


3 import os 
4 from random import randrange as rrange 
3 


6 COLSIZ = 10 

7 RDBMSs = Cs’: 'sglite', 'm' : ’mysql’, 'g': 'gadfly ] 
ó DB EXC = None 

9 

10 def setup: 

11 return RDBMSs[raw input C?’ 

12 Choose a database system: 

13 

14 (MySQL 

15 (G)adfly 

16 (S)QLite 

17 

18 Enter choice: '''). strip O. lower O [0/] 
19 

20 def connect(db, dbName): 

21 global DB EXC 

22 dbDir = 狼狗 % (db, dbName) 
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24 if db = ‘sqlite’: 
25 try: 
26 import sqlite’ 





27 except ImportError, e: 

28 try: 

29 from pysqlite2 import dbapi2 as sqlite3 
30 except ImportError, e: 

31 return None 

32 

33 DB EXC = sqlite3 

34 if not os. path. isdir(dbDir): 

35 os. mkdir (dbDir) 

36 cxn = sqlite. connect (os. path. join(dbDir, dbName)) 
37 

38 elif db == ‘mysql’: 

39 try: 

40 import MySQLdb 

4l import _mysql exceptions as DB EXC 

42 except ImportError, e: 

43 return None 

44 

45 try: 

46 cxn = MySQLdb. connect (db-dbName) 

47 except mysql exceptions. OperationalError, e: 
48 cxn = MySQLdb. connect (user-' root’) 

49 try: 

50 cxn. query ( DROP DATABASE %s’ % dbName) 
51 except DB EXC. OperationalError, e: 

32 pass 

53 cxn. query ( CREATE DATABASE %s’ % dbName) 
54 cxn. query (“GRANT ALL ON %s. * to ''&' localhost’ ^ % dbName) 
55 cxn. commi t () 

56 cxn. close () 

57 cxn = MySQLdb. connect (db-dbName) 

I8 

59 elif db == 'gadfly': 

60 try: 

61 from gadfly import gadfly 

62 DB EXC = gadfly 

63 except ImportError, e: 
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64 return None 

65 

66 try: 

67 cxn = gadfly(dbName, dbDir) 
68 except IOError, e: 

69 cxn = gadfly () 

70 if not os. path. isdir(dbDir): 
71 os. mkdir (dbDir) 

72 cxn. startup (dbName, dbDir) 
73 else: 

74 return None 





75 return cxn 

76 

77 def create (cur): 

78 try: 

79 cur. execute  "' 

80 CREATE TABLE users ( 
81 login VARCHAR (8), 

82 uid INTEGER, 

83 prid INTEGER) 

84 ''7) 

85 except DB EXC. ÜperationalError, e: 
86 drop (cur) 

87 create (cur) 


88 

89 drop = lambda cur: cur. execute DROP TABLE users’) 
90 

91 NAMES = ( 


92 ( aaron’, 8312), C angela’, 7603), ( dave’, 7306), 
93 (davina’, 7902), (elliot’, 7911), (ernie’, 7410), 
94 ( jess’, 7912), C jim, 7512), (larry’, 7311), 

95 ( leslie’, 7808), (melissa’, 8602), (pat’, 7711), 
96 ( serena’, 7003), (stan’, 7607), ( faye’, 6812), 
97 Camy’, 7209), 

98 ) 

99 

100 def randName (): 

101 pick = list (NAMES) 

102 while len(pick) > 0: 

103 yield pick. pop (rrange (len (pick))) 
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104 

105 def insert(cur, db): 

106 if db == 'sglite': 

107 cur. executemany ("INSERT INTO users VALUES(?, 2 ?)”, 
108 [ (who, uid, rrange(1, 5)) for who, uid in randName QOJ) 
109 elif db == 'gadfly': 

110 for who, uid in randName(): 

111 cur. execute (“INSERT INTO users VALUES(?, ? ?)^, 

112 (who, uid, rrange (1, 5))) 

113 elif db == "mysal : 

114 cur. executemany (“INSERT INTO users VALUES (s, %s, %s)”, 
115 [(who, uid, rrange(1, 5)) for who, uid in randName QJ) 
116 

117 getRC = lambda cur: cur. rowcount if hasattr(cur, 





'rowcount') else -1 

118 

119 def update (cur): 

120 fr = rrange (1, 5) 

121 to = rrange(L 5) 

122 cur. execute ( 

123 "UPDATE users SET prid=%d WHERE prid=%d° % (to, fr)) 
124 return fr, to, getRC(cur) 

125 

126 def delete (cur): 

127 rm = rrange (1, 5) 

128 cur. execute (C DELETE FROM users WHERE prid=%d’ % rm) 
129 return rm, getRC(cur) 

130 

131 def dbDump (cur): 

132 cur. execute C SELECT * FROM users’) 

133 print '|nfsfistis" % C LOGIN'. 1 just (COLSIZ), 

134 'USERID'. J just (COLSIZ), 'PROJZ'. 1 just (COLSIZ)) 

135 for data in cur. fetchall: 

136 print 'WsWsts' % tuple([str(s). title. Ljust(COLSIZ) | 
137 for s in dataj) 

138 

139 def main: 

140 db = setup 0 

141 print '*** Connecting to %r database’ % db 

142 cxn = connect (db, 'test') 
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143 if not cxn: 

144 print 'ERROR: %r not supported, exiting’ % db 
145 return 

146 cur - cxn. cursor () 

147 

148 print ’ \n*** Creating users table’ 

149 create (cur) 

150 

151 print '|m*** Inserting names into table’ 
152 insert (cur, db) 

153 dbDump (cur) 

154 

155 print ’ \n**x Randomly moving folks’, 

156 fr, to, num = update (cur) 

157 print 'from one group (%d) to another (%d)’ % (fr, to) 
158 print *\t(%d users moved)’ % num 

159 dbDump (cur) 

160 

161 print ’ \n*** Randomly choosing group’, 
162 rm, num = delete (cur) 

163 print ’ (%d) to delete’ % rm 

164 print '|t(*Ód users removed)’ % num 

165 dbDump (cur) 

166 

167 print ’ \n*** Dropping users table’ 

168 drop (cur) 

169 cur. close () 

170 cxn. commit () 

171 cxn. close ( 








172 
173 if name = ' main 
174 main(Q 


例子 21. 1 数据 库 接口 程序 示例 








MySQL (38-57 行 ) 的 数据 文件 会 存 保 在 默认 的 数据 存储 区 域 ， 所 以 不 需要 用 户 指定 存储 位 置 . 我 
们 的 代码 尝试 连接 指定 的 数据 库 . 如 果 发 生 错误 ， 有 可 能 是 数据 库 不 存在 或 者 虽然 数据 库存 在 但 我 
们 没有 权限 访问 它 ， 由 于 这 仅仅 是 一 个 测试 应 用 程序 ， 我 们 选择 完全 先 删 掉 这 个 数据 库 ( 忽 略 掉 如 
果 数 据 库 不 存在 可 能 引发 的 错误 )， 然 后 重建 该 库 ， 然 后 给 访问 它 的 用 户 赋予 权限 . 
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我 们 的 应 用 程序 支持 的 最 后 一 个 数据 库 是 Gadfly GB 59-75 行 )， 在 本 书写 作 的 时 候 ， 这 个 数据 
库 已 经 几乎 但 还 没有 完全 兼容 DB-API， 你 也 会 在 这 个 程序 里 看 到 这 一 点 .) 它 使 用 类 似 SQLite 的 局 
动机 制 : 它 的 启动 目录 是 数据 文件 所 在 的 目录 .如果 数 据 文件 在 那儿 ，OK， 如 果 那 儿 没 有 数据 文件 ， 
你 必须 重新 启动 一 个 新 的 数据 库 . (为 什么 非 要 这 样 ， 我 们 也 不 十 分 清楚 . 我 们 认为 startupO R 
数 应 该 被 合并 到 构造 器 函数 gadfly. gadfly 0 当中 去 ). 














第 77-89 行 

create) 函数 在 数据 库 中 创建 一 个 新 的 users 表 ， 如 果 中 间 产 生 问 题 ， 几 乎 肯定 是 因为 这 个 
Aus. S 如果 正 是 这 个 原因 的 话 ， 删 掉 这 个 表 ， 然 后 递归 调用 create O 函数 来 重新 创建 它 ， 这 
个 代码 有 一 个 缺陷 ， 就 是 当 重 建 表 仍 然 失 败 的 话 ， 你 将 陷入 死 循 环 ， 直 至 内 存 耗 尽 . 在 本 章 最 后 有 
一 道 习题 就 是 这 个 问题 ， 你 可 以 试 着 修复 这 个 潜在 的 bug. 














= 


























91-103 47 

这 可 能 是 除了 数据 库 操作 之 外 最 有 趣 的 代码 部 分 了 ， 它 由 一 组 固定 用 户 名 及 ID 值 的 集合 及 一 个 
生成 器 函数 randName () 构成 ， 这 个 函数 的 代码 也 可 以 在 第 11 章 的 11. 10 小 节 找 到 .NAMES 常量 是 
一 个 元 组 ， 因 为 我 们 在 randName () 这 个 生成 器 里 需要 改变 它 的 值 ， 所 以 我 们 必须 在 randName () 里 
先 将 它 转换 为 一 个 列表 ， 我 们 一 次 随机 的 移 除 一 个 名 字 ， 直 到 列表 为 空 为 止 ， 如 果 NAMES 本 身 是 
一 个 列表 ， 我 们 只 能 使 用 它 一 次 ( 它 就 被 消耗 光 了 )， 我 们 将 它 设计 成 为 一 个 元 组 ， 这 样 我 们 就 可 以 
多 次 从 这 个 元 组 生成 一 个 列表 供 生成 器 使 用 . 























105-115 fT 

由 于 各 种 数据 库 之 间 有 一 些 细微 差别 ，insert O 函数 里 的 代码 是 依赖 具体 数据 库 的 ， 举 例 来 说 ， 
SQLite 和 MySQL 的 接口 程序 都 是 DB-API 兼容 的 ， 所 以 它们 的 游标 对 象 都 拥有 executemany O 77 
法 ， 可 是 是 Gadfly 没有 这 个 方法 ， 因 此 它 只 能 一 次 插入 一 行 . 























另 一 个 不 同 之 处 在 于 SQLite 和 Gadfly 的 参数 风格 是 qmark， 而 MySQL 的 参数 风格 是 
format. 

由 于 这 些 原因 ， 格 式 字符 串 必 须 不 同 ， 如 果 你 比较 细心 的 话 ， 你 会 看 到 他 们 的 参数 创建 过 程 非 
常 相似 . 











这 段 代 码 的 功能 是 : 对 每 个 name-userID 数据 对 ， 随 机 分 配 一 个 项 目 小 组 id(, 然后 存 入 数据 
库 ). 


第 117 行 

这 独立 的 一 行 是 有 一 个 条 件 表达 式 EVE, Python 3 目 操作 符 )， 它 返回 最 后 一 步 操 作 所 影响 的 
行 数 ， 如 果 游 标 对 象 不 支持 这 个 属性 (也 就 是 说 这 个 接口 程序 不 兼容 DB-APT) 的 话 ， 它 返回 -1. 

python 2.5 中 新 增 了 条 件 表达 式 ， 如 果 你 使 用 的 是 python 2.4.x 或 更 老 版 本 ， 你 可 能 需要 将 
它 转换 为 老 风 格 的 方式 ， 如 下 : 


























getRC = lambda cur: (hasattr(cur, 'rowcount/) | 
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and [cur. rowcount] or [-1/)[0] 








如 果 你 对 这 行 代码 看 不 太 明 白 ， 不 用 着 急 . 看 看 FAQ 就 能 知道 为 什么 最 终 Python 2.5 中 加 入 
了 条 件 表 达 式 .如 果 你 能 弄 明 白 ， 你 就 彻底 搞 明 白 了 python 对 象 以 及 他 们 的 布尔 值 . 


第 119-129 行 
update() 和 delete() 函数 随机 从 一 个 组 里 选择 了 几 条 记录 ， 如 果 是 update 操作 ， 就 将 他 
们 从 当前 小 组 移 到 另 一 个 小 组 (也 是 随机 选择 的 )， 如 果 是 delete 操作 ， 则 删除 它们 


第 131-137 行 
dbDump O 函数 从 数据 库 中 读 取 所 有 数据 ， 并 将 数据 进行 格式 化 ， 然 后 显示 给 用 户 看 ，print 语 
名 显示 每 个 用 户 不 够 清晰 ， 所 以 我 们 将 它 分 开 显示 . 














首先 ， 通 过 fetchallO 方法 读 取 数据 ， 然 后 迭代 遍历 每 个 用 户 ， 将 三 列 数据 (login，uid,， 
prid) 转换 为 字符 串 (如 果 它 们 还 不 是 的 话 )， 并 将 姓 和 名 的 首 字母 大 写 ， 再 格式 化 整个 字符 为 左 对 
齐 的 COLSIZ 列 . (HAAA) . 由 代码 生成 的 字符 串 是 一 个 列表 (通过 列表 解析 ， list 
comprehension)， 我 们 需要 将 它们 转换 成 一 个 元 组 以 支持 % 运算 符 . 











第 139-174 1T 

本 部 影片 的 导演 main O 出 场 . 它 将 上 面 定义 的 这 些 函 数组 织 起 来 ， 让 他 们 尽情 发 挥 . (假定 
它们 没有 因为 找 不 到 数据 库 接口 程序 或 者 不 能 得 到 有 效 连接 对 象 而 中 途 退 出 [第 143-145 47]). € 
的 大 部 分 代码 都 是 能 够 自我 解释 的 print 语句 ， 最 后 main) 关闭 游标 对 象 ， 提 交 操 作 ， 然 后 关 
闭 数据 库 连接 .脚本 的 最 后 几 行 代码 用 来 启动 脚本 的 执行 . 


























21.3 对象 -关系 管理 器 (ORMs) 








通过 前 一 节 我 们 知道 ， 如 今 有 很 多 种 数据 库 系 统 ， 他 们 中 的 绝 大 多 数 都 有 Python 接口 ， 以 方便 
你 驾驶 他 们 的 能 量 .， 这 些 系 统 唯一 的 缺点 是 需要 你 懂得 SQL， 如 果 你 是 一 个 喜欢 折腾 Python 对 象 
却 讨厌 SQL 查询 的 家 伙 ， 又 想 使 用 关系 型 数据 库 做 为 你 的 数据 存储 的 后 端 ， 你 就 完全 具备 成 为 一 
个 ORM 用 户 的 天 资 . 

















21.3.1 考虑 对 象 ， 而 不 是 SQL 








这 些 系统 的 创建 者 将 绝 大 多 数 纯 SQL 层 功 能 抽象 为 Python 对 象 ， 这 样 你 就 无 需 编 写 SQL 也 能 够 
完成 同样 的 任务 .如 果 你 在 某 些 情况 下 实在 需要 SQL， 有 些 系统 也 人 允许 你 拥有 这 种 灵活 性 .但 绝 大 
多 数 情况 下 ， 你 应 该 尽量 避免 进行 直接 的 SQL 查询 . 






































数据 库 的 表 被 转换 为 Python 类 ， 它 具有 列 属 性 和 操作 数据 库 的 方法 ， 让 你 的 应 用 程序 支持 
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ORM 非常 类 似 使 用 那些 标准 的 数据 库 接口 程序 ， 由 于 大 部 分 工作 由 ORM 代为 处 理 ， 相 比 直接 使 用 
接口 程序 来 说 ， 一 些 事情 可 能 实际 需要 更 多 的 代码 .男人 欣慰 的 是 ， 一 点 点 额外 的 付出 会 回报 你 更 
高 的 生产 率 . 




















21.3.2 Python 和 ORM 





如 今 最 知名 的 Python ORM 模块 是 SQLAlchemy 和 SQLObject. 由 于 二 者 有 着 不 同 的 设计 哲学 ， 
我 们 会 分 别 给 出 SQLAlchemy 和 SQLObject 的 例子 . 只 要 你 能 搞 清 楚 这 两 种 ORM 的 使 用 ， 转 到 其 它 
的 ORM 将 是 相当 简单 的 事 . 

















其 它 的 Python ORM 包括 PyDO/PyDO2, PDO, Dejavu, Durus, QLime 和 ForgetSQL. 一 些 大 型 
的 Web 开发 工具 /框架 也 可 以 有 自己 的 ORM 组 件 ， 如 WebWare MiddleKit 和 Django 的 数据 库 API. 
需要 指出 的 是 ， 知 名 的 ORM 并 不 意味 着 就 是 最 适合 你 的 应 用 程序 的 ORM. 那些 其 它 的 ORM 虽然 没 
有 纳入 我 们 的 讨论 范围 ， 但 一 样 有 可 能 是 适合 你 的 应 用 程序 的 选择 . 





























21. 3.3 雇员 数据 库 举例 


W. 数据 库 后 端 仍然 是 MySQL， 相 对 于 直接 使 用 原始 SQL 来 讲 ， 我 们 使 用 ORM 时 用 类 代替 了 函数 ， 
这 样 会 更 有 对 象 的 感觉 ， 两 个 例子 都 使 用 了 ushuffle db. py 中 的 NAMES 集合 和 随机 名 字 选 择 
BM. 这 是 为 了 避免 将 同样 的 代码 到 处 复制 -粘贴 ， 代 码 能 够 被 有 效 重用 是 件 好 事情 


现在 我 们 将 shuffle 应 用 程序 ushuffle db. py 改造 为 使 用 SQLAlchemy 和 SQLOb ject SE 





S us 











SQLAlchemy 

与 SQLObject FAEK, SQLAlchemy 的 接口 在 某 种 程度 上 更 接近 SQL， 所 以 我 们 先 从 SQLAlchemy 
开始 . SQLAlchemy 的 抽象 层 确 实 相 当 完 美 ， 而 且 在 你 必须 使 用 SQL 完成 某 些 功能 时 ， 它 提供 了 足够 
的 灵活 性 ， 你 会 发 现 这 两 个 ORM 模块 在 设置 及 存 取 数 据 时 使 用 的 术语 非常 相似 ， 代 码 长 度 也 很 接近 ， 
都 比 ushuffle_db. py 少 . (包括 共享 的 names 列表 和 随机 名 字 生 成 器 ). 

















逐 行 解释 


第 1-10 1T 
和 前 面 一 样 ， 第 一 件 事 是 导入 相关 的 模块 和 常量 ， 我 们 倡导 首先 导入 Python 标准 库 模 块 ， 然 后 
再 导入 第 三 方 或 扩展 模块 ， 最 后 导入 本 地 模块 这 种 风格 这 些 常 量 都 是 自 解释 的 ， 所 以 无 需 废话 . 























第 12-31 行 
是 类 的 构造 器 ， 类 似 ushuffle db.connectO. 它 确保 数据 库 可 用 并 返回 一 个 有 效 连 接 (第 
18-31 行 )， 这 也 是 唯一 能 看 到 原始 SQL 的 地 方 . 这 是 一 种 典型 的 操作 任务 ， 不 是 面向 应 用 的 任务 . 
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第 33-44 1T 
这 个 try-except FA) OR 33-40 行 ) 用 来 重新 载 入 一 个 已 有 的 表 ， 或 者 在 表 不 存在 的 情况 下 创 
建 一 个 新 表 ， 最 终 我 们 得 到 一 个 合适 的 对 象 实例 . 

















例子 21.2 SQLAlchemy ORM 例子 
这 个 user shuffle 程序 的 主角 是 SQLAlchemy 前 端 和 MySQL 数据 库 后 端 


7 #!//usr/bin/env python 
2 
3 import os 
4 from random import randrange as rrange 
5 from sqlalchemy import * 
6 from ushuffle db import NAMES, randName 
A 
8 FIELDS = ( login’, 'uid', 'prid') 
9 DBNAME = ° test’ 
10 COLSIZ = 10 
11 
12 class MySQLAIchemy (object): 
13 def | init (self, db, dbName): 
14 import MySQLdb 
15 import mysql exceptions 
16 MySQLdb = pool. manage (MySQLdb) 
17 url = 'mysgl://db-fís' % DBNAME 
18 eng = create engine (url) 
19 try: 
20 cxn = eng. connection () 
21 except mysql exceptions. ÜperationalError, e: 
22 engl = create engine( mysgl://user-root') 
23 try: 
24 engl. execute (DROP DATABASE fis" % DBNAME) 
25 except mysql exceptions. ÜÜperationalError, e: 
26 pass 
27 engl. execute ( CREATE DATABASE %s’ % DBNAME) 
28 engl. execute( 
29 “GRANT ALL ON %s. * TO ’’@ localhost’” % DBNAME) 
30 engl. commit () 
31 cxn = eng. connection () 
32 
33 try: 
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34 users = Table( users’, eng, autoload-True) 





35 except exceptions. SQLError, e: 

36 users = Table( users’, eng, 

37 Column( login’, String(8)), 

38 Column( uid', Integer), 

39 Column( prid', Integer), 

40 redefine-True) 

41 

42 self. eng = eng 

43 self. cxn = cxn 

44 self. users = users 

45 

46 def create(self): 

47 users = self. users 

48 try: 

49 users. drop 0) 

50 except exceptions. SQLError, e: 

bl pass 

52 users. create () 

33 

54 def insert (self): 

55 d = [dict (zip FIELDS, 
56 [who, uid, rrange(1, 5)/)) for who, uid in randName OJ 
57 return self. users. insert (). execute (#d). rowcount 
58 
59 def update(self): 

60 users = self. users 

6l fr = rrange (1, 5) 
62 to = rrange(1, 5) 
63 return fr, to, | 
64 users. update (users. c. prid==fr). execute (prid-to). rowcount 
65 
66 def delete(self): 
67 users = self. users 
68 rm = rrange (1, 5) 
69 return rm, | 

70 users. delete (users. c. prid==rm). execute (). rowcount 
71 

72 def dbDump (self): 

73 res = self. users. select (). execute () 
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74 print '|nfísfístis" % ( LOGIN’. 1 just (COLSIZ), 

75 'USERID'. 1 just (COLSIZ), ° PROJE . 1 just (COLSIZ)) 
76 for data in res fetchall(): 

77 print 'fWsfístis" % tuple([str(s). title. ljust 
(COLSIZ) for s in dataj) 

78 

79 def  getattr (self, attr): 

80 return getattr(self. users, attr) 

ó1 

82 def finish(self): 

83 self. cxn. commit () 

84 self. eng. commit () 

85 

86 def main(): 

87 print '"*** Connecting to %r database’ % DBNAME 
88 orm = MySQLAIchemy ( mysql’, DBNAME) 

89 

90 print ° \n*** Creating users table’ 





91 orm. create () 
92 
93 print '|m*** Inserting names into table’ 
94 orm. insert Q 
95 orm. dbDump () 
96 
97 print ° \n*** Randomly moving folks’, 
98 fr, to, num = orm. update() 
99 print 'from one group (%d) to another (%d)’ % (fr, to) 
100 print *\t(%d users moved)’ % num 
101 orm. dbDump 0 
102 
103 print 
104 rm, num = orm.delete() 
105 print ° (4d) to delete’ % rm 
106 print *\t(%d users removed)’ % num 
107 orm. dbDump 0 
108 
109 print '|m*** Dropping users table’ 
110 orm. drop Ô 
111 orm. finishQ 
112 


P4 


|n#** Randomly choosing group’, 
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113 if name == ” main 
114 main Q 








例子 21.2 SQLAlchemy ORM 示例 (ushuffle sa. py) 


第 46-70 47 
这 四 个 方法 处 理 数 据 库 核心 功能 : 创建 表 (46-52 行 )， 插 入 数据 (54-57 行 )， 更 新 数据 (59-64 
行 )， 删 除数 据 (66-70 行 )， 我 们 也 有 一 个 方法 用 来 删除 表 . 











def drop(self): 

self. users. drop () 

or 

drop = lambda self: self. users. drop () 


不 过 ， 我 们 还 是 决定 提供 另 一 种 委托 处 理 方式 ( 曾 在 第 13 章 ， 面 向 对 象 编程 中 介绍 )， 委 托 处 理 
就 是 指 一 个 方法 调用 不 存在 时 ， 转 交 给 另 一 个 拥有 此 方法 的 对 象 去 处 理 ， 参 见 第 79-80 行 的 解释 . 




















第 72-77 行 
输出 内 容 由 dbDump 0 方法 完成 ， 它 从 数据 库 中 得 到 数据 ， 就 象 ushuffle db. py 中 那样 对 数 
据 进 行 美化 ， 事 实 上 ， 这 部 分 代码 几乎 完全 相同 . 








Lines 79 - 80 

应 该 尽量 避免 为 一 个 表 创 建 一 个 drop( 方法 ， 因 为 这 总 是 会 调用 table 自身 的 dropO X 
法 ， 同 样 ， 既 然 没 有 新 增 功能 ， 那 我 们 有 什么 必要 要 创建 另 一 个 函数 ?无 论 属 性 查找 是 否 成 功 特殊 
方法  getattr 0 总 是 会 被 调用 ， 如 果 调 用 orm drop) 却 发 现 这 个 对 象 并 没有 droo) 方法 ， 
getattr(orm, “drop ) 就 会 被 调用 .发 生 这 种 情况 时 ， _getattr  O 被 调用 ， 之 后 将 这 个 属性 名 委 
托 给 self. users. 解释 器 会 发 现 self.users 有 一 个 drop 属性 并 执行 . 


















































Example 21.3 SQLObject ORM Example (ushuffle so. py) 
这 个 user shuffle 应 用 程序 的 主角 前 端 是 SQLOb ject， 后 端 是 MySQL 数据 库 . 


7 #!/usr/bin/env python 

2 

3 import os 

4 from random import randrange as rrange 
5 from sglobject import * 

6 from ushuffle db import NAMES, randName 


7 
8 DBNAME = ° test’ 
9 COLSIZ = I0 





$— 一 * 一 
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10 FIELDS = ( login’, 'uid', 'prid') 
11 

12 class MySQLOb ject (object): 

13 def | init (self, db, dbName): 
14 import MySQLdb 

15 import mysgl exceptions 

16 url = 'mysgl://localhost/"Ms' % DBNAME 
17 

18 while True: 

19 cxn = connectionForURI (url) 

20 sqlhub. processConnection = cxn 





21 fcxn. debug = True 
22 try: 
23 class Users (SQLOb ject) : 
24 class sqlmeta: 
25 fromDatabase = True 
26 login = StringCol (length=8) 
27 uid = IntCol() 

28 prid = IntCol 0 

29 break 

30 except _mysql exceptions. ProgrammingError, e: 
31 class Users (SQLObject): 

32 login = StringCol (length-8) 

33 uid = IntCol 0 

34 prid = IntCol 0 

33 break 

36 except mysql exceptions. OperationalError, e: 
37 cxnl = sqlhub. processConnection= 
connectionForURI C mysql://root@localhost’) 
38 cxnl. query ( CREATE DATABASE %s” % DBNAME) 
39 cxnl. query (GRANT ALL ON %s. * TO ""& 
localhost'^ % DBNAME) 

40 cxnl. close ( 

4l self. users = Users 

42 self. cxn = cxn 

43 

44 def create(self): 

45 Users = self. users 

46 Users. dropTable (True) 

47 Users. createTable () 
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48 

49 def insert (self): 

50 for who, uid in randName(): 

51 self. users (**dict (zip (FIELDS, 

52 [who, uid, rrange (1, 5)/))) 

53 

54 def update(self): 

55 fr = rrange (1, 5) 

56 to = rrange (1, 5) 

57 users = self. users. selectBy (prid-fr) 





58 for i, user in enumerate (users): 
59 user. prid = to 
60 return fr, to, itl 
61 
62 def delete(self): 
63 rm = rrange (1, 5) 
64 users = self. users. selectBy (prid=rm) 
65 for i, user in enumerate (users): 
66 user. destroySelf () 
67 return rm, itl 
68 
69 def dbDump (self): 
70 print '|nfísfístis" % C LOGIN’. 1 just (COLSIZ), 
71 'USERID'. 1just (COLSIZ), ° PROJ#’. 1 just (COLSIZ)) 
72 for usr in self. users. select  : 
73 print 'fWsfistis" % (tuple([str(getattr(usr, 
74 field)). title. ljust (COLSIZ) | 
75 for field in FIELDS])) 
76 
77 drop = lambda self: self. users. dropTable () 
78 finish = lambda self: self. cxn. close 0 
79 
80 def main0: 
81 print '*** Connecting to %r database’ % DBNAME 
82 orm = MySQLOb ject ( mysql’, DBNAME) 
83 
84 print ’ \n*** Creating users table’ 
85 orm. create () 
86 
87 print '|m*** Inserting names into table’ 
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88 orm. insert () 

89 orm. dbDump () 

90 

91 print ’ \n*xx Randomly moving folks’, 





92 fr, to, num = orm. update 0) 

93 print 'from one group (%d) to another (%d)’ % (fr, to) 
94 print °’\t(%d users moved)’ % num 

95 orm. dbDump 0) 

96 

97 print 'VMr*** Randomly choosing group’, 
98 rm, num = orm. delete() 

99 print ° (%d) to delete’ % rm 

100 print *\t(%d users removed)’ % num 
101 orm. dbDump 0 

102 

103 print ° \n*** Dropping users table’ 
104 orm. drop Ô 

105 orm. finish Q 

106 

107 if name  -- ' main 


108 main() 





Lines 82 - 84 
最 后 一 个 方法 是 finish， 它 来 提交 整个 事务 . 











第 86-114 行 

main) 函数 是 整个 应 用 程序 的 入 口 ， 它 创建 了 一 个 MySQLAlchemy 对 象 并 通过 它 完成 所 有 的 
数据 库 操 作 . 这 段 脚本 和 ushuffle db. py 功能 一 样 ， 你 会 注意 到 数据 库 参 数 db 是 可 选 的 , 而 且 
在 ushuffle sa.py FIRM AES 的 ushuffle so. py 中 ， 它 不 起 任何 作用 . 它 只 是 一 个 占 位 符 以 方 
便 你 对 这 个 应 用 程序 添加 其 它 的 数据 库 支 持 . (参见 本 章 后 面 的 习题 ) 














运行 这 段 脚本 ， 你 会 看 到 类 似 下 面 的 输出 : 
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$ ushuffle sa. py 





XXk Connecting to 'test' database 


*** Creating users table 


*** [nserting names into table 


LOGIN USERID PROJ# 
Serena 7003 4 
Faye 6812 4 
Leslie 7808 3 
Ernie 7410 1 
Dave 7306 2 
Melissa 8602 1 
Amy 7209 3 
Angela 7603 4 
Jess 7912 2 
Larry 7311 1 
Jim 7512 2 
Davina 7902 3 
Stan 7607 4 
Pat 7711 2 
Aaron 8312 Za 
Elliot 7911 3 


*** Randomly moving folks from one group (1) to another (3) 
(3 users moved) 


LOGIN USERID PROT# 
Serena 7003 4 
Faye 6812 4 
Leslie 7808 3 
Ernie 7410 3 
Dave 7306 2 
Melissa 8602 3 
Amy 7209 3 
Angela 7603 4 
Jess 7912 2 
Larry 7311 3 
Jim 7512 2 
Davina 7902 3 
Stan 7607 4 
Pat TTL 2 
Aaron 8312 2 
Elliot 7911 3 
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*** Randomly choosing group (2) to delete 
(5 users removed) 


LOGIN USERID PROJ# 
Serena 7003 4 
Faye 6812 4 
Leslie 7808 3 
Ernie 7410 3 
Melissa 8602 3 
Amy 7209 3 
Angela 7603 4 
Larry 7311 3 
Davina 7902 3 
Stan 7607 4 
Elliot 7911 3 


*** Dropping users table 


$ 
逐 行 解释 


第 1-10 íF 
除了 我 们 使 用 的 是 SQLObject 而 不 是 SQLAlchemy 以 外 ， 导 入 模块 和 常量 声明 几乎 与 
ushuffle sa.py 相同 . 














12-42 行 
$ 类 似 我 们 的 SQLAlchemy 例子 ， 类 的 构造 器 做 大 量 工作 以 确保 有 一 个 数据 库 可 用 ， 然 后 返回 一 E 
个 连接 ， 同 样 的 ， 这 也 是 你 能 在 程序 里 看 到 SQL 语句 的 唯一 位 置 ， 我 们 这 个 程序 ， 如 果 因 为 某 种 原 

因 造 成 SQLOb ject 无 法 成 功 创建 用 户 表 ， 就 会 陷入 无 限 循环 当中 . 























我 们 尝试 能 够 聪明 的 处 理 错 误 ， 解 决 掉 这 个 重建 表 的 问题 ， 因 为 SQLObject 使 用 元 类 ， 我 们 
知道 类 的 创建 幕后 发 生 特殊 事件 ， 所 以 我 们 不 得 不 定义 两 个 不 同 的 类 ， 一 个 用 于 表 已 经 存在 的 情况 ， 
一 个 用 于 表 不 存 的 情况 .代码 工作 原理 如 下 : 

















L 尝试 建立 一 个 连接 到 一 个 已 经 存在 的 表 .， 如 果 正 常 工作 ，0K. (第 23-29 行 ) 

2. 如 果 第 一 步 不 成 功 ， 则 从 零 开 始 为 这 个 表 创 建 一 个 类 ， 如 果 成 功 ，OK. (第 31-36 行 ) 

3， 如 果 第 二 步 仍 不 成 功 ， 我 们 的 数据 库 可 能 遇 到 麻烦 ， 那 就 重新 创建 一 个 新 的 数据 库 (第 
37-40 行 ) 

4. 重新 开始 新 的 循环 . 




















希望 程序 最 终 能 在 第 一 步 或 第 二 步 成 功 完 成 ， 当 循环 结束 时 ， 类 似 ushuffle_sa. py， 我 们 得 到 
合适 的 对 象 实例 . 


第 44-67 行 ，77-78 行 
这 些 行 处 理 数据 库 操作 . 我 们 在 44-47 行 创 建 了 表 ， 并 在 77 行 删 掉 了 表 . 在 49-52 行 插入 数据 ， 
在 54-60 行 更 新 数据 ， 在 62-67 行 删 除了 数据 .78 行 调 用 了 finish () 方 法 来 关闭 数据 库 连 接 ， 我 们 


4 a 
$— 一 圭一 co 
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不 能 象 SQLAlchemy 那样 使 用 删 表 代理 ， 因 为 SQLObject 的 删 表 代 理 名 为 dropTable 0 而 不 是 
drop () . 


第 69-75 fF 
使 用 dbDump O DE, dA NA Pepe SE, FRR aN fe BREE. 


第 80-108 fT 
又 到 了 main) 函数 . 它 工 作 的 方式 非常 类 似 ushuffle sa.py . 同样 的 ， 构 造 器 的 db BR 
仅仅 是 一 个 占 位 符 ， 用 以 支持 其 它 的 数据 库 系 统 (参阅 本 章 最 后 的 习题 ) 





当 你 运行 这 段 脚本 时 ， 你 的 输出 可 能 类 似 这 样 : 
$ ushuffle so.py 


*** Connecting to 'test' database 
*** Creating users table 


*** Inserting names into table 


LOGIN USERID PROT# 
Jess 7912 if 
Amy 7209 4 
Melissa 8602 2 
Dave 7306 4 
Angela 7603 4 
Serena 7003 2 
Aaron 8312 1 
Leslie 7808 1 
Stan 7607 3 
Pat TELI 3 
Jim 7512 4 
Larry of oy Ba d 3 
Ernie 7410 2 
Faye 6812 4 
Davina 7902 at 
Elliot 7911 4 


*** Randomly moving folks from one group (2) to another (3) 
(3 users moved) 
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LOGIN USERID PROJ# 
Jess 7912 1 
Amy 7209 4 
Melissa 8602 3 
Dave 7306 4 
Angela 7603 4 
Serena 7003 3 
Aaron 8312 1. 
Leslie 7808 1 
Stan 7607 3 
Pat THU 3 
Jim 7512 4 
Larry 73411 3 
Ernie 7410 3 
Faye 6812 4 
Davina 7902 时 


Elliot 7911 


[ 


*** Randomly choosing group (3) to delete 
(6 users removed) 


LOGIN USERID PROJ# 
Jess 7912 1 
Amy 7209 4 
Dave 7306 4 
Angela 7603 4 
Aaron 8312 L 
Leslie 7808 1 
Jim 7512 4 
Faye 6812 4 
Davina 7902 1 


Elliot 7911 


[ 


*** Dropping users table 


$ 


21.3.4 总 结 





关于 如 何在 python 中 使 用 关系 型 数据 库 ， 和 希望 我 们 前 面 介 绍 的 东西 对 你 有 用 ， 当 你 应 用 程序 的 
需求 超出 纯 文本 或 类 似 DBM 等 特殊 文件 的 能 力 时 ， 有 多 种 数据 库 可 以 选择 ， 别 忘 了 还 有 一 个 完全 由 
Python 实现 的 真正 的 免 安装 维护 和 管理 的 真实 数据 库 系统 ， 你 能 在 下 面 找到 多 种 Python 数据 库 接口 
程序 和 ORM 系统 ， 我 们 也 建议 你 研究 一 下 互联 网 上 的 DB-SIG 的 网 页 和 邮件 列表 ， 类 似 其 它 的 软件 
开发 领域 ， 只 不 过 Python 更 简单 易学 ， 用 户 体验 更 好 . 


21. 4 相关 模块 
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x 21.8 列 出 了 常见 的 Python 数据 库 接口 程序 ， 注 意 不 是 所 有 的 接口 程序 都 是 DB-API 兼容 























的 . 
表 21.8 数据 库 相 关 模 块 及 其 站 点 
名 字 网 站 ”参考 或 描述 
数据 库 
Gadfly http://gadfly. sf. net 
MySQL http://mysql.com or http://mysql. org 
MySQLdb a.k.a. MySQL- 
Python http: //sf. net/projects/mysql-python 
PostgreSQL — http://postgresql. org 
Psycopg http: //initd. org/projects/psycopgl 
psycopg2 http://initd. org/software/initd/psycopg/ 
PyPgSQL http://pypgsql. sf. net 
PyGreSQL http://pygresql. org 
PoPy LASER, 5 PyGreSQL 项 目 合 并 
SQLite http://sqlite. org 
pysqlite http://initd. org/projects/pysqlite 
sglite3 pysqlite 已 经 整合 到 Python 标准 库 ; 除非 你 要 下 载 最 新 的 补丁 ， 否 则 建议 
使 用 标准 库 


APSW http://rogerbinns. com/apsw. html 
dé 21.8 数据 库 相 关 模 块 及 其 站 点 ( 续 ) 





A 网 站 ”参考 或 描述 

数据 库 

MaxDB (SAP) http: //mysql. com/products/maxdb 

sdb http: //dev. mysql. com/downloads/maxdb/7. 6. 00. html tPython 
sapdb http: //sapdb. org/sapdbPython. html 

Firebird (InterBase) http: //firebird. sf. net 








KInterbasDB http: //kinterbasdb. sf. net 

SQL Server http: //microsoft. com/sql 

pymssql http://pymssql. sf. net (requires FreeTDS [http://freetds. org]) 
adodbapi http: //adodbapi. sf. net 


Sybase http://sybase. com 
sybase http://object-craft. com. au/projects/sybase 
Oracle http://oracle. com 
cx Oracle http://starship. python. net/crew/atuining/cx Oracle 
DCOracle2 http://zope. org/Members/matt/dco2 
(older, for Oracle8 only) 
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Ingres http://ingres. com 


Ingres DBI http: //ingres. com/products/Prod Download Python DBI. html 
ingmod http://www. informatik. uni-rostock. de/ hme/software/ 

ORMs 

SQLOb ject http://sqlobject. org 

SQLAlchemy http: //sqlalchemy. org 

PyDO/PyD02 http://skunkweb. sf. net/pydo. html 

a. pysqlite 已 经 添加 到 python2. 5 中 ， 作 为 它 的 sqlite3 模块 


21.5 练习 





21-1. 什么 是 Python DB-API? 它 是 一 个 好 东西 么 ? 为 什么 是 ? (或 为 什么 不 是 ?) 
21-2. 描述 一 下 数据 库 模块 参数 风格 之 间 的 不 同 在 哪儿 ? 
21 - 3. 游标 对 象 的 execute*O 系列 方法 有 何 区 别 ? 
21-4 ”游标 对 象 的 fetch) 系列 方法 有 何 区 别 ? 
21-5. ”研究 一 下 你 使 用 的 数据 库 及 相应 的 python 模块 ， 它 是 否 与 DB-API 兼容 ? 该 模块 是 
否 提 供 了 DB-API 必须 功能 之 外 的 更 多 特性 ? 
+ 21-6. 针对 你 使 用 的 数据 库 和 DB-API 接口 程序 ， 学 习 使 用 Type 对 象 写 一 段 小 的 脚本 ， 至 $ 



































少 要 用 到 其 中 的 一 个 对 象 . 

21-7. Hey 例子 21. 1(ushuffle db.py) 中 的 create() 函数 ， 一 个 table 会 先 被 删除 ， 
然后 递归 调用 createO 函数 重建 这 个 table. 如 果 在 重建 这 个 table 时 失败 ， 就 会 陷入 无 限 循 
环 之 中 ， 通 过 在 异常 处 理 中 不 再 调用 create 命令 (cur. execute O) 修复 这 个 问题 ， 搞 一 个 更 实用 
的 解决 方案 出 来 ， 附 加 题 : 实现 如 果 创 建 table 失败 ， 在 返回 失败 之 前 最 多 重 试 三 次 . 





























21 - 8. 

数据 库 和 html 利用 现 有 数据 库 的 一 个 表 和 你 在 第 20 章 学 到 的 开发 知识 ， 读 出 数据 库 表 的 内 容 ， 
将 它 放 到 一 个 html table PR. 

21-9. ”数据 库 网 站 开发 给 我 们 的 user shuffle 例子 写 一 个 网 页 界面 . 

21-10. 数据库 界面 编程 给 我 们 的 user shuffle 例子 写 一 个 图 形 界面 . 

21-11. 股票 投资 组 合 类 修改 第 十 三 章 股 票数 据 的 例子 ， 将 它 改 造 为 使 用 某 一 种 关系 数据 库 
保存 数据 . 

21 - 12. 切换 ORM 后 端 为 其 它 的 数据 库 . 将 SQLAlchemy(ushuffle sa.py) 或 
SQLOb ject (ushuffle_so. py) 应 用 程序 后 端 数据 库 由 MySQL 切换 为 男 一 种 数据 库 系 统 . 
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章 主题 
引言 /动机 
扩展 Python 
创建 应 用 程序 代码 
用 样板 包装 你 的 代码 
编译 
导入 并 测试 
引用 计数 
线程 和 GIL 
相关 话题 
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在 本 章 中 ， 我 们 将 讨论 如 何 编写 扩展 代码 并 将 它们 的 功能 整合 到 Python 编程 环境 中 来 。 首 先 我 
们 会 给 出 这 样 做 的 原因 ， 然 后 一 步 步 地 教 您 如 何 做 。 应 当 指 出 的 是 ， 虽 然 大 部 分 Python 的 扩展 都 是 
用 C 语言 写 的 ， 并 且 下 面 的 所 有 样 例 代码 也 都 是 由 纯 C 语言 写 的 ， 但 请 放心 ， 这 些 代码 很 容易 就 可 
以 移植 到 C++ 中 。 


$ 22.1 介绍 /动机 E 


22.1.1 什么 是 扩展 












































一 般 来 说 ， 所 有 能 被 整合 或 导入 到 其 它 python 脚本 的 代码 ， 都 可 以 被 称 为 扩展 。 您 可 以 用 纯 
Python 来 写 扩 展 ， 也 可 以 用 C 和 C++ 之 类 的 编译 型 的 语言 来 写 扩 展 ( 或 者 也 可 以 用 Java 给 Jython 写 
扩展 ， 也 可 以 用 CHÈ Visual Basic. NET 4 IronPython 写 扩展 ) 。 











Python 的 一 大 特点 就 是 ， 扩 展 和 解释 器 之 间 的 交互 方式 与 普通 的 Python 模块 完全 一 样 。Python 
在 设计 之 初 就 考虑 到 要 让 模块 的 导入 机 制 足够 抽象 。 抽 象 到 让 使 用 模块 的 代码 无 法 了 解 到 模块 的 具 
体 实现 细节 。 除非 那个 程序 员 在 磁盘 中 搜索 这 个 模块 文件 , 否则 , 他 /她 就 连 这 个 模块 到 底 是 用 Python 
写 的 ， 还 是 用 某 种 编译 语言 写 的 都 分 辩 不 了 。 





























核心 笔记 : 在 不 同 平台 上 创建 扩展 

我 们 要 注意 的 是 ， 如 果 你 曾 自己 编译 过 Python 解释 器 ， 那 么 ， 在 这 样 的 环境 中 ， 扩 展 一 般 都 是 
可 以 使 用 的 。 自 己 手动 编译 扩展 ， 和 获取 扩展 的 二 进 制 文件 是 有 一 些 不 一 样 的。 虽然 自己 编译 比 简 
单 的 下 载 安 装 复杂 一 些 ， 但 由 此 得 来 的 好 处 就 是 ， 你 可 以 自由 选择 你 想 使 用 的 Python 的 版 本 。 

虽然 本 章 中 的 例子 都 是 在 Unix 系统 中 开发 的 (一 般 的 unix 中 ， 都 自 带 编译 器 ) 。 但 只 要 你 能 
用 C/C++ (或 Java) 的 编译 器 并 且 C/C++ (或 Java) 中 有 Python 的 开发 环境 。 那 唯一 的 区 别 只 是 怎样 来 








—o— 
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编译 而 已 。 无 论 在 哪 一 个 平台 上 , 真正 起 作用 的 代码 都 是 一 样 的 。 如 果 你 在 Win32 平台 上 进行 开发 ， 
你 需要 有 Visual C++ 开发 环境 。Python 的 发 布 包 中 自 带 了 7. 1 版 本 的 项 目 文件 。 当 然 ， 你 也 可 以 使 
用 老 版 本 的 VC。 

想 了 解 更 多 的 关于 如 何在 Win32 上 开发 扩展 的 信息 ， 你 可 以 访问 如 下 网 页 : 

http://docs. python. org/ext/building-on-windows. html 

警告 :就 算是 相同 的 架构 的 两 台电 脑 之 间 最 好 也 不 要 互相 共享 二 进 制 文件 。 最 好 是 在 各 自 的 电 
脑 上 编译 Python 和 扩展 。 因 为 ， 有 时 就 算是 编译 器 或 是 CPU 之 间 的 些许 差异 ， 也 会 导致 代码 不 能 
常 工作 。 





22.1.2 为 什么 要 扩展 Python? 











纵 观 软件 工程 的 历史 ， 编 程 语 言 都 不 具备 可 扩展 性 ， 你 只 能 使 用 已 有 的 功能 ， 而 不 能 为 语言 增 
加 新 功能 。 现 如 今 的 编程 环境 中 ， 可 定制 性 也 是 一 个 很 大 的 卖点 。 它 可 以 促进 代码 的 复 用 。TCL 和 
Python 等 语言 是 第 一 批 提供 可 扩展 性 的 语言 。 那 么 ,为 什么 我 们 会 想 要 扩展 像 Python 这 种 已 经 很 完 
善 的 语言 呢 ? 有 以 下 几 点 好 理由 : 


1 


e 添加 /额外 的 〈 非 Python) 功能 。 扩 展 Python 的 一 个 原因 就 是 出 于 对 一 些 新 功能 的 需要 ， 
而 Python 语言 的 核心 部 分 并 没有 提供 这 些 功能 。 这 时 ， 通 过 纯 Python 代码 或 者 编译 扩展 都 
可 以 做 到 。 但 是 有 些 情况 ， 比 如 创建 新 的 数据 类 型 或 者 将 Python RABI E CAE EM DY 
用 程序 中 ， 则 必须 得 编译 。 

e 人 性 能 瓶颈 的 效率 提升 。 众 所 周知 ， 由 于 解释 型 的 语言 是 在 运行 时 动态 的 翻译 解释 代码 ， 这 导 
致 其 运行 速度 比 编译 型 的 语言 慢 。 一 般 说 来 ， 把 所 有 代码 都 放 到 扩展 中 ， 可 以 提升 软件 的 整 
体 性 能 。 但 有 时 ， 由 于 时 间 与 精力 有 限 ， 这 样 做 并 不 划算 。 通 常 ， 先 做 一 个 简单 的 代码 性 能 
测试 ， 看 看 瓶颈 在 哪里 ， 然 后 把 瓶颈 部 分 在 扩展 中 实现 会 是 一 个 比较 简单 有 效 的 做 法 。 效 果 
立竿见影 不 说 ， 而 且 还 不 用 花费 太 多 的 时 间 与 精力 。 

© 保持 专 有 源 代码 私密 。 创 建 扩展 的 另 一 个 很 重要 的 原因 是 脚本 语言 都 有 一 个 共同 的 缺陷 , AE 
就 是 所 有 的 脚本 语言 执行 的 都 是 源 代码 ， 这 样 一 来 源 代码 的 保密 性 便 无 从 谈 起 了 。 把 一 部 分 
代码 从 Python 转 到 编译 语言 就 可 以 保持 专 有 源 代码 私密 。 因 为 ， 你 只 要 发 布 二 进 制 文件 就 
可 以 了 。 编 译 后 的 文件 相对 来 说 ， 更 不 容易 被 反 向 工程 出 来 。 因 此 ， 代 码 能 实现 保密 。 尤 其 
是 涉及 到 特殊 的 算法 ， 加 密 方法 以 及 软件 安全 的 时 候 ， 这 样 做 就 显得 非常 至 关 重 要 了 。 

男 一 种 对 代码 保密 的 方法 是 只 发 布 预 编译 后 的 . pyc 文件 。 这 是 介 于 发 布 源 代码 (. py 文件 ) 和 把 

代码 移植 到 扩展 这 两 种 方法 之 间 的 一 种 较 好 的 折 中 的 方法 。 
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22.2 创建 Python 扩展 











为 Python 创建 扩展 需要 三 个 主要 的 步骤 : 





1. 创建 应 用 程序 代码 
2.， 利 用 样板 来 包装 代码 
3， 编 译 与 测试 





在 这 一 节 中 ， 我 们 会 将 这 三 步 逐 一 介绍 给 大 家 。 


22.2.1 创建 您 的 应 用 程序 代码 














首先 ， 我 们 要 建立 的 是 一 个 “ 库 ” 要 记 住 ， 我 们 要 建立 的 是 将 在 Python 内 运行 的 一 个 模块 。 
所 以 在 设计 你 所 需要 的 函数 与 对 象 的 时 候 要 注意 到 ， 你 的 C 代码 要 能 够 很 好 的 与 Python 的 代码 进行 
双向 的 交互 和 数据 共享 。 

















然后 ， 写 一 些 测试 代码 来 保障 你 的 代码 的 正确 性 。 你 可 以 在 C 代码 中 放 一 个 main O 函数 ， 使 得 
你 的 代码 可 以 被 编译 并 链接 成 一 个 可 执行 文件 (而 不 是 一 个 动态 库 ) ， 当 你 运行 这 个 可 执行 文件 时 ， 

















程序 可 以 对 你 的 软件 库 进行 回归 测试 。 这 种 是 一 种 很 符合 Python 风格 的 做 法 。 








在 下 面 的 例子 中 ， 我 们 就 将 采用 这 种 做 法 。 测 试用 例 分 别针 对 我 们 想 要 导出 到 Python 世界 的 两 
个 函数 。 一 个 是 递归 求 阶乘 的 函数 fac O 。 另 一 个 reverse O 函数 实现 了 一 个 简单 的 字符 串 反 转 算法 ， 
其 主要 目的 是 修改 传 入 的 字符 串 ， 使 其 内 容 完全 反 转 ， 但 不 需要 申请 内 存 后 反 着 复制 的 方法 。 由 于 
涉及 到 指针 的 使 用 ， 我 们 务必 要 在 设计 和 调试 时 小 心 谨慎 ， 以 防 把 问题 带 入 Python. 


























Example 22.1 中 所 列 出 的 Extestl. c 是 我 们 的 第 一 个 版 本 。 


代码 中 ， 包 含 了 两 个 函数 fac (和 reverse()。 分 别 实现 了 我 们 刚刚 所 说 的 两 个 功能 。fac 0 接 
受 一 个 整数 参数 并 递归 计算 结果 ， 在 退出 最 后 一 层 调 用 后 最 终 返回 到 调用 代码 中 。 











最 后 一 段 代 码 是 必要 的 main) 函数 。 我 们 在 这 里 面 写 测试 代码 ， 传 不 同 的 参数 给 facO 和 
reverse()。 有 了 这 个 函数 ， 我 们 就 可 以 了 解 我 们 的 代码 是 否 能 得 到 正确 的 结果 。 

















现在 ， 我 们 就 可 以 编译 这 段 代码 了 。 在 大 部 分 有 gcc 编译 器 的 unix 系统 中 ， 我 们 都 可 以 用 以 下 
指令 进行 编译 : 


$ gcc Extestl.c -o Extest 
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我 们 可 以 输入 以 下 命令 来 运行 我 们 的 程序 ， 并 得 到 如 下 输出 : 





$ Extest 
4! == 24 
8! == 40320 


12! == 479001600 
reversing 'abcdef', we get 'fedcba' 


. I 2 E 3 
reversing madam, we get madam 


$ 


Example 22.1 Pure C Version of Library (Extestl.c) 





下 面 列 出 了 我 们 想 要 包装 并 在 Python 解释 器 中 使 用 的 c 函数 的 代码 , main O 是 测试 函数 


1 #include <stdio. h^ 
2 #include <stdlib. h> 
3 Zinclude <string. h> 
4 
5 int fac( int n) 
6 7 
7 if Q < 2) return (Dr /* 0! == 1! = 1 ww 
8 return (n)*fac(n-1); /* n! == n*(n-1)! «/ 
9} 
10 
11 char *reverse( char *s) 
p 
13 register char t, /* tmp */ 
14 *p = s, /* fwd */ 
15 *q = (s + (strlen(s)-1)); /x bwd */ 
16 
17 while œ <Q) /* ifp<q */ 
18 { /* swap & mv ptrs */ 


19 t = %p; 
20 *ptt = *q; 
21 *q-— = t; 
22 } 

23 return s; 
24 } 
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26 int main() 

27 ( 

28 char sÍBUFSIZJ/; 

29 printf (4! == %d\n*, fac(4)); 

30 printf( 8! == %d\n*, fac(8)); 

31 printf 12! == %d\n*, fac(12)); 

32 stropy(s, 'abcdef^); 

33 printf (reversing 'abcdef', we get 'Ws'|n^, | 
34 reverse(s)); 

35 strcpy (s, “madam”); 





^ | 


36 printf (reversing '"madam , we get 'fWs'|nf, 
37 reverse(s)); 

38 return 0; 

39 ] 








我 们 要 再 强调 一 次 ， 你 应 该 尽 可 能 的 完善 你 的 代码 。 因 为 ， 在 把 代码 集成 到 Python 中 后 再 来 调 
试 你 的 核心 代码 ， 查 找 潜在 的 bug 是 件 很 痛苦 的 事情 。 也 就 是 说 ， 调 试 核心 代码 与 调试 集成 这 两 件 
事 应 该 分 开 来 做 。 要 知道 ， 与 Python 的 接口 代码 写 得 越 完善 ， 集 成 的 正确 性 就 越 容易 保证 。 


























候 应 该 不 会 有 什么 问题 。 注 意 ， 到 现在 为 止 ， 我 们 所 做 的 都 还 与 Python 没什么 关系 。 我 们 只 是 简 
单 地 创建 了 一 个 C/C++ 的 应 用 程序 而 已 。 





我 们 的 两 个 函数 都 只 接受 一 个 参数 ， 并 返回 一 个 值 。 这 是 很 标准 的 情况 ， 与 Python 集成 的 时 





22.2.2 用 样板 来 包装 你 的 代码 








整个 扩展 的 实现 都 是 围绕 着 13. 15. 1 节 所 说 的 “包装 ”这 个 概念 进行 的 。 你 的 设计 要 尽 可 能 让 
你 的 实现 语言 与 Python 无 颖 结合 。 接 口 的 代码 被 称 为 “样板 ”代码 ， 它 是 你 的 代码 与 Python 解释 
器 之 间 进 行 交 互 所 必 不 可 少 的 一 部 分 。 








我 们 的 样板 主要 分 为 4 步 : 


1. BA Python 的 头 文件 。 

2， 为 每 个 模块 的 每 一 个 函数 增加 一 个 型 如 PyOb ject* Module func O 的 包装 函数 。 
3， 为 每 个 模块 增加 一 个 型 如 PyMethodDef ModuleMethods[] 的 数组 。 

4. 增加 模块 初始 化 函数 void initModule O 











包含 Python 头 文件 














首先 ， 你 要 找到 Python 的 头 文 件 在 哪 ， 并 且 确 保 你 的 编译 器 有 权限 访问 它们 。 在 大 多 数 类 Unix 














$— 一 * 一 
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的 系统 里 ， 它 们 都 会 在 /usr/1local/include/python2. x at /usr/include/python?. x 目录 中 。 其 中 ， 
“2.x“ 是 你 所 使 用 的 Python 的 版 本 号 。 如 果 你 兽 编译 并 安装 过 Python 解释 器 ， 那 应 该 不 会 碰 到 什么 
问题 ， 因 为 这 时 ， 系 统一 般 都 会 知道 你 的 文件 安装 在 哪 。 像 下 面 这 样 在 你 的 代码 里 加 入 一 行 : 


#include “Python. h^ 





这 部 分 比较 简单 。 接 下 来 再 看 看 怎么 在 样板 中 加 入 其 它 的 部 分 。 





为 每 个 模块 的 每 一 个 函数 增加 一 个 型 如 Py0bjectx* Module func 0 的 包装 函数 。 











这 一 部 分 最 需要 技巧 。 你 需要 为 所 有 想 被 Python 环境 访问 的 函数 都 增加 一 个 静态 的 函数 ， 函 数 
的 返回 值 类 型 为 Py0bject*， 函 数 名 前 面 要 加 上 模块 名 和 一 个 下 划 线 (_) 。 





比方 说 ， 我 们 希望 在 Python 中 ， 能 够 import 我 们 的 fac 0 函数， 其 所 在 的 模块 名 为 Extest 那 
么 ， 我 们 就 要 创建 一 个 包装 函数 叫 Extest_fac () 。 在 使 用 这 个 函数 的 Python 脚本 中 ， 使 用 方法 是 先 
"import Extest 然后 调用 “Extest. fac O” (nk # 75" from Extest import fac”， 然 后 直接 调用 
"Tae t] 











包装 函数 的 用 处 就 是 先 把 Python 的 值 传递 给 C， 然 后 调用 我 们 想 要 调用 的 相关 函数 。 当 这 个 函 
数 完 成 要 返回 Python 的 时 候 ， 把 函数 的 计算 结果 转换 成 Python 的 对 象 ， 然 后 返回 给 Python. 

















对 于 fac O 函数 来 说 ， 当 客户 程序 调用 Extest. fac O 的 时 候 ， 我 们 的 包装 函数 就 会 被 调用 。 它 
接受 一 个 Python 的 整数 参数 ， 把 它 转 为 C 的 整数 ， 然 后 调用 C 的 facQ 函数 ， 得 到 一 个 整 型 的 返回 
值 ， 最 后 把 这 个 返回 值 转 为 Python 的 整 型 数 做 为 整个 函数 调用 的 结果 返回 回去 。 (在 你 头脑 中 ， 要 
保持 一 个 想法 : 我 们 所 写 的 其 实 就 是 "def fac (n) “这 段 声明 的 一 个 代理 函数 , 当代 理 函 数 返 回 的 时 候 ， 
就 像 是 这 个 想像 中 的 Python 的 fac O 函数 在 返回 一 样 。) 





























那么 ， 你 就 会 可 了 ， 怎 样 才 能 完成 这 样 的 转换 呢 ? BAB, FEM Python 到 C 的 转换 就 用 
PyArg_Parse# 系 列 函 数 。 在 从 C 转 到 Python BEES, SEHR] Py BuildValue O 函数 








PyArg Parse 系列 函数 的 用 法 跟 C 的 sscanf 函数 很 像 ， 都 接受 一 个 字符 串 流 ， 并 根据 一 个 指定 
的 格式 字符 串 进行 解析 ， 把 结果 放 入 到 相应 的 指针 所 指 的 变量 中 去 。 它 们 的 返回 值 为 1 表示 解析 成 
功 ， 返 回 值 为 0 表示 失败 。 








Py BuildValue 的 用 法 跟 sprintf 很 像 ， 把 所 有 的 参数 按 格式 字符 串 所 指定 的 格式 转换 成 一 个 
Python 的 对 象 。 





表 22. 1 罗列 了 这 些 函 数 的 概要 。 


X 22.2 所 列 出 的 转换 代码 用 于 在 C 与 Python 之 间 做 数据 的 转换 。 
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这 些 转换 代码 出 现在 格式 字符 串 当中 ， 用 于 指定 各 个 值 的 数据 类 型 ， 以 便于 在 两 种 语言 之 间 做 
转换 。 注 : 由 于 Java 的 所 有 数据 类 型 都 是 类 ， 所 以 Java 的 转换 类 型 不 一 样 。Python 对 象 在 Java 中 
所 对 应 的 数据 类 型 请 参考 Jython 的 相关 文档 。C# 也 有 同样 的 问题 。 


X 22.1 Python 和 C/C++ 之 间 的 数据 转换 


函数 描述 

Python to C 

int 

PyArg ParseTuple O 把 Python 传 过 来 的 参数 转 为 C 

Int 

PyArg ParseTupleAndKeywords () 5 PyArg ParseTuple O 作用 相同 ， 但 是 同时 解析 关键 字 参 数 
C to Python 


PyObject* Py BuildValue() JE C 的 数据 转 为 Python 的 一 个 对 象 或 一 组 对 象 , 然后 返回 之 。 


Table 22.2 Common Codes to Convert Data Between Python 
and C/C++ 


Format Code Python Type C/C++ Type 
S str char* 
Z str/None char*/NULL 
T int int 
l long long 
c str char 
d float double 
D complex Py Complex* 
o (any) PyObject* 
S str PyStringObject 


IN 


aa + 
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下 面 是 完整 的 Extest fac 函数 : 


Static PyObject * 
Extest_fac(PyObject *self, PyObject *args) { 





int res; // parse result 
int num; // arg for fac() 
PyObject* retval; // return value 


res = PyArg ParseTuple(args, "i", &num); 
if (!res) { // TypeError 
return NULL; 
} 
res = fac(num); 
retval = (PyObject*)Py_BuildValue("i", res); 
return retval; 


首先 ， 我 们 要 解析 Python 传 过 来 的 数据 。 例 子 中 ， 我 们 使 用 格式 字符 串 i”， 表 示 我 们 期 望 得 
到 一 个 整 型 的 变量 。 如 果 传 进来 的 的 确 是 一 个 整 型 的 变量 ， 那 就 把 它 保存 到 num Be, AM, 
PyArg_ParseTuple 0 会 返回 NULL, 同时 , 我 们 的 函数 也 返回 一 个 NULL。 这 时 , 就 会 产生 一 个 TypeError 
异常 ， 通 知客 户 我 们 期 望 传 入 一 个 整 型 变量 。 








然后 ， 我 们 会 调用 fac 0 函数， 其 参数 为 num， 把 返回 结果 放 在 res 变量 中 。 最 后 ， 通 过 调用 
Py BuildValue 0 函数， 格式 字符 串 为 “i”， 把 结果 转 为 Python 的 整数 类 型 并 返回 。 这 样 ， 我 们 就 
完成 了 整个 调用 过 程 。 


事实 上 ， 包 装 函 数 写 得 多 了 之 后 ， 你 会 慢 慢 的 把 代码 写 得 越 来 越 得 ， 以 减少 中 间 变 量 的 使 用 ， 
同时 也 会 增加 代码 的 可 读 性 。 我 们 以 Extest_fac 0 函数 为 例 ， 把 它 改 写 得 短小 一 些 ， 只 使 用 一 个 变 


JEL 
= num: 








static PyObject * 
Extest_fac(PyObject *self, PyObject *args) { 
int num; 
if (!PyArg_ParseTuple(args, "i", &num)) 
return NULL; 
return (PyObject*)Py BuildValue("i", fací(num)); 
} 


那么 reverse 怎么 实现 呢 ? 既然 你 已 经 知道 怎么 返回 一 个 值 了 , 那 我 们 把 reverse O 的 需求 稍微 
改 一 下 ， 变 成 返回 两 个 值 。 我 们 将 返回 一 个 包含 两 个 字符 串 的 tuple。 第 一 个 值 是 传 进来 的 字符 串 ， 
第 二 个 值 是 反 转 后 的 字符 串 。 





我 们 将 把 这 个 函数 命名 为 Extest. doppelO ， 以 示 与 reverse () 函数 的 区 别 。 把 代码 包装 到 
Extest doppelO 函数 后 ， 我 们 得 到 如 下 代码 : 





aa + 
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Static PyObject * 
Extest doppel(PyObject *self, PyObject *args) { 
char *orig str; 
if (!PyArg ParseTuple(args, "s", &orig str)) return NULL; 
return (PyObject*)Py BuildValue("ss", orig str, \ 
reverse(strdup(orig str))); 





) 
WR Extest_fac 类似 ， 我 们 接收 一 个 字符 串 型 的 参数 ， 保 存 到 orig str H. HER, KK, XI 
要 使 用 s “格式 字符 串 。 然 后 调用 strdup 0 函数 把 这 个 字符 串 复制 一 份 ( 由 于 我 们 要 同时 返回 原始 字 
符 串 和 反 转 后 的 字符 串 ， 所 以 我 们 需要 复制 一 份 )。 把 新 复制 的 字符 串 传 给 reverse 函数 ， 我 们 就 得 
到 了 反 转 后 的 字符 串 。 




















如 你 所 见 ,我 们 用 ss” 格式 字符 串 让 Py BuildValue O 函数 生成 了 一 个 含有 两 个 字符 串 的 tuple, 
分 别 放 了 原始 字符 串 和 反 转 后 的 字符 串 。 这 样 就 完成 所 有 的 工作 了 吗 ? 很 不 幸 ， 还 没 。 








我 们 碰 到 了 C 语言 的 一 个 陷阱 : 内 存 泄 露 。 即 内 存 被 申请 了 ， 但 没有 被 释放 。 就 像 去 图 书馆 借 
了 书 ， 但 是 没有 还 一 样 。 无 论 何 时 ， 你 都 应 该 释放 所 有 你 申请 的 ， 不 再 需要 的 内 存 。 看 ! 我 们 写 的 
代码 犯 了 多 大 的 罪过 啊 。 (虽然 看 上 去 好 像 很 无 率 的 样子 ) 











那 两 个 字符 串 就 会 被 复制 出 来 。 问 题 就 在 于 ， 我 们 申请 了 用 于 存放 第 二 个 字符 串 的 内 存 ， 但 是 ， 在 
退出 的 时 候 没 有 释放 它 。 于 是 ， 这 广内 存 就 泄露 了 。 正 确 的 做 法 是 : 先生 成 要 返回 的 对 象 ， 然 后 释 
放 在 包装 函数 中 申请 的 内 存 。 我 们 必需 要 这 样 这 样 修改 我 们 的 代码 : 

















OO， 





static PyObject * 
Extest doppel(PyObject *self, PyObject *args) { 
char *orig str; // 原始 字符 串 
char *dupe str; // 反 转 后 的 字符 串 
PyObject* retval; 
if (IPyArg ParseTuple(args, "s^, &orig str)) 
return NULL; 


retval = (PyObject*)Py BuildValue(^ss^, orig str, \ 
dupe str-reverse(strdup(orig str))); 

free(dupe str); 

return retval; 


} 








我 们 用 dupe str 变量 指向 了 新 申请 的 字符 串 , 并 依 此 生成 了 要 返回 的 对 象 。 然 后 ,我 们 调用 free O 
函数 释放 这 个 字符 串 ， 最 后 ， 返 回 到 调用 程序 。 终 于 ， 完 成 了 我 们 要 做 的 事情 。 











e 
* 





E E 
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为 每 个 模块 增加 一 个 型 如 PyMethodDef ModuleMethods 口 的 数组 。 

















现在 ， 我 们 已 经 完成 了 两 个 包装 函数 。 我 们 需要 把 它们 列 在 某 个 地 方 ， 以 便于 Python 解释 器 能 
够 导入 并 调用 它们 。 这 就 是 ModuleMethods [数组 要 做 的 事情 。 








这 个 数组 由 多 个 数组 组 成 。 其 中 的 每 一 个 数组 都 包含 了 一 个 函数 的 信息 。 最 后 放 一 个 NULL 数组 
表示 列表 的 结束 。 我 们 为 Extest 模块 创建 一 个 ExtestMethods[] 数组: 











static PyMethodDef 

ExtestMethods[] = { 

{ “fac”, Extest fac, METH VARARGS }, 

{ “doppel”, Extest doppel, METH VARARGS }, 
{ NULL, NULL }, 
js 


每 一 个 数组 都 包含 了 函数 在 Python 中 的 名 字 ， 相 应 的 包装 函数 的 名 字 以 及 一 个 METH. VARARGS 

常量 。 其 中 ，METH VARARGS 常量 表示 参数 以 tule 形式 传 入 。 如 果 我 们 要 使 用 

PyArg ParseTupleAndKeywords O 函数 来 分 析 命 名 参数 的 话 ， 我 们 还 需要 让 这 个 标志 常量 与 
四 METH KEYWORDS 常量 进行 逻辑 与 运算 常量 。 最 后 ， 用 两 个 NULL 来 结束 我 们 的 函数 信息 列表 。 E 









































增加 模块 初始 化 函数 void initModule() 








所 有 工作 的 最 后 一 部 分 就 是 模块 的 初始 化 函数 。 这 部 分 代码 在 模块 被 导入 的 时 候 被 解释 器 调用 。 
在 这 段 代 码 中 ， 我 们 需要 调用 Py InitModule 0 函数 ， 并 把 模块 名 和 ModuleMethods [ ] ZH BE 4 546 
递 进 去 ， 以 便于 解释 器 能 正确 的 调用 我 们 模块 中 的 函数 。 对 Extest 模块 来 说 ，initExtest O 函数 应 
该 是 这 个 样子 的 : 


























void initExtest() { 
Py InitModule("Extest^, ExtestMethods) ; 
} 


这 样 ， 所 有 的 包装 都 已 经 完成 了 。 我 们 把 以 上 代码 与 之 前 的 Extestl.c 合并 到 一 个 新 文件 
Extest2.c P. SEXE, 我 们 的 开发 阶段 就 已 经 结束 了 。 








创建 扩展 的 男 一 种 方法 是 先 写 包装 代码 ， 使 用 桩 函数 ， 测 试 函数 或 哑 函 数 。 在 开发 过 程 中 慢 慢 
的 把 这 些 函 数 用 有 实际 功能 的 函数 奉 换 。 这 样 ， 你 可 以 确保 Python 和 C 之 间 的 接口 函数 是 正确 的 ， 
并 用 它们 来 测试 你 的 C 代码 。 
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22.2.2 编译 











现在 ， 我 们 已 经 到 了 编译 阶段 。 为 了 让 你 的 新 Python 扩展 能 被 创建 ， 你 需要 把 它们 与 Python 
库 放 在 一 起 编译 .现在 已 经 有 了 一 套 跨 30 多 个 平台 的 规范 , 它 极 大 的 方便 了 编写 扩展 的 人 。distutils 
包 被 用 来 编译 ， 安 装 和 分 发 这 些 模 块 ， 扩 展 和 包 。 这 个 模块 在 Python2. 0 的 时 候 就 已 经 出 现 了 ， 并 
FAT ACS 1. x 版 本 时 的 用 Makefile 来 编译 扩展 的 方法 。 使 用 distutils 包 的 时 候 我 们 可 以 方便 的 按 
以 下 步骤 来 做 : 























1， 创 建 setup. py 
2. 通过 运行 setup. py 来 编译 和 连接 您 的 代码 
3. M Python 中 导入 您 的 模块 

4， 测 试 功能 





创建 setup. py 











下 一 步 就 是 要 创建 一 个 setup. py 文件 。 编 译 最 主要 的 工作 由 setup O 函数 来 完成 。 在 这 个 函数 
调用 之 前 的 所 有 代码 , 都 是 一 些 预备 动作 。 为 了 能 编译 扩展 ,你 要 为 每 一 个 扩展 创建 一 个 Extension 


实例 ， 在 这 里 ， 我 们 只 有 一 个 扩展 ， 所 以 只 要 创建 一 个 Extension 实例 : 
Extension( Extest’, sources-('ExtestZ. c’ /) 
第 一 个 参数 是 (完整 的 ) 扩展 的 名 字 ， 如 果 模 块 是 包 的 一 部 分 的 话 ， 还 要 加 上 用 ”分 隔 的 完整 


的 包 的 名 字 。 我 们 这 里 的 扩展 是 独立 的 ， 所 以 名 字 只 要 写 “Extest” 就 好 了 。sources 参数 是 所 有 源 代 
码 的 文件 列表 。 同 样 ， 我 们 也 只 有 一 个 文件 : Extest2. c. 




















< 






































现在 ， 我 们 可 以 调用 setup) f. setup 需要 两 个 参数 :一 个 名 字 参 数 表 示 要 编译 哪个 东西 ， 一 
个 列表 列 出 要 编译 的 对 象 。 由 于 我 们 要 编译 的 是 一 个 扩展 ， 我 们 把 ext modules 参数 的 值 设 为 扩展 
模块 的 列表 。 语 法 如 下 : 


~ 








setup( Extest’, ext modules-[... J) 

例 22. 2 编译 脚本 (setup. py) 

这 个 脚本 会 把 我 们 的 扩展 编译 到 build/1ip.* 子 目录 中 。 
1#!/usr/bin/env python 


2 
3from distutils. core import setup, Extension 
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4 

5MOD = 'Extest' 

6setup (name-MOD, ext modules-[ 
7Extension (MOD, sources-['ExtestZ. c’ J) [) 














由 于 我 们 只 有 一 个 模块 。 我 们 把 我 们 扩展 模块 对 象 的 实例 化 操作 放 到 了 setup O 的 调用 代码 中 。 
模块 的 名 字 我 们 就 传 预先 定义 的 “常量 ”MOD: 











MOD = ’Extest’ 
setup (name-MOD, ext modules-[ 
Extension (MOD, sources-['ExtestZ. c’ J) [) 


setup () 函数 还 有 很 多 选项 可 以 设置 。 限 于 篇 幅 ， 不 能 完全 罗列 。 读 者 可 以 在 本 章 最 后 所 列 的 官 
方 文档 中 找到 setup. py 和 setup O 函数 相关 的 信息 。 例 22. 2 给 出 了 我 们 例子 所 要 用 的 完整 的 脚本 代 
码 。 








通过 运行 setup. py 来 编译 和 连接 您 的 代码 





现在 , 我 们 已 经 有 了 setup. py 文件 ,运行 setup. py build 命令 就 可 以 开始 编译 我 们 的 扩展 了 。 
在 我 们 的 Mac 机 上 的 输出 如 下 〔 使 用 不 同 版 本 的 Python 或 是 不 一 样 的 操作 系统 时 ， 输 出 会 有 一 些 
AD: 





$ python setup. py build running build 

running build ext 

building 'Extest' extension creating build 
creating build/temp. macosx-10. x-fat-2. x 

gcc -fno-strict-aliasing -lWno-long-double -no-cpp- 





precomp -mno-fused-madd —-fno-common -dynamic -DNDEBUG -g 

-I/usr/incilude -I/usr/local/include —I/sw/include -I/ usr/local/include/python2. x -c 
ExtestZ c -o build/ temp. macosx-10. x-fat-2. x/Extest2. o 

creating build/lib.macosx-10. x-fat-Z. x 

ecc -g -bundle -undefined dynamic lookup -L/usr/lib -L/ usr/local/lib -L/sw/lib 
-I/usr/inciude  -I/usr/local/ include  -I/sw/include  build/temp. macosx-10. x-fat-2Z. x/ 
Extest2 0 -o build/lib. macosx—l0. x-fat-2. x/Extest. so 


22.2.3 导入 和 测试 


从 Python 中 导入 您 的 模块 





$— 一 * 一 
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你 的 扩展 会 被 创建 在 你 运行 setup. py 脚本 所 在 目录 下 的 bui1d/1ib. * 目 录 中 。 你 可 以 切换 到 屠 
个 目录 中 来 测试 你 的 模块 ， 或 者 也 可 以 用 以 下 命令 把 它 安装 到 你 的 Python 中 : 





$ python setup. py install 
如 果 安 装 成 功 ， 你 会 看 到 : 


running install 

running build 

running build ext 

running install lib 

copying build/lib.macosx-10. x-fat-2. x/Extest. so 一 
/usr/local/lib/pythonZ. x/site-packages 


现在 ， 我 们 可 以 在 解释 器 里 测试 我 们 的 模块 了 : 


222 import Extest 
>> Extest. fac (5) 

120 

25^ Extest. fac (9) 

362880 

25» Extest. doppel ( abcdefgh’) 
(abcdefgh’, 'hgfedcba') 
>»» Extest. doppel (Madam, I'm Adam. ^) 
(Madam, I’m Adam. ^, ^ madA m I , madaM”) 


测试 功能 














我 们 想 要 做 的 最 后 一 件 是 就 是 加 上 一 个 测试 函数 。 事 实 上 , 我 们 已 经 写 了 一 个 了 .。 就 是 那个 main () 
函数 。 现 在 ， 在 我 们 代码 中 放 一 个 main) 函数 是 一 件 比 较 和 危险 的 事 。 因 为 ， 一 个 系统 中 ， 只 能 有 一 
个 mainO 函数。 我 们 把 main O 函数 改名 为 test 0) ， 加 个 Extest test O 函数 把 它 包 装 起 来 ， 然 后 在 
ExtestMethods 中 加 入 这 个 函数 就 不 会 有 这 样 的 问题 了 。 代 码 如 下 : 


static PyObject * 

Extest test(PyObject *self, PyObject xargs) { 
test; 
return (Py0bject*)Py BuildValue(~*),; 

J 

static PyMethodDef 

ExtestMethods[] = { 





$— 一 * 一 
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{ “fac”, Extest fac, METH VARARGS }, 
{ “doppel”, Extest doppel, METH VARARGS j, 
{ “test Extest test, METH VARARGS j, 
{ NULL, NULL }, 
Ts 





Extest test (模块 函数 只 负责 运行 test O 函数 ， 并 返回 一 个 空 字符 串 。Python 的 None 作为 返 
回 值 ， 传 给 了 调用 者 。 现 在 ， 我 们 可 以 在 Python 中 ， 调 用 同样 的 test O 函数 了 : 


22» Extest. test () 

4! == 24 

8! == 40320 

12! == 479001600 

reversing 'abcdef', we get 'fedcba' 
reversing 'madam', we get 'madam' 


Pre 
在 例 22.3 中 ， 我 们 给 出 了 Extest2. c 的 最 终 版 本 。 这 个 版 本 会 输出 我 们 刚才 所 看 到 的 结果 。 
在 本 例 中 ， 我 们 把 我 们 的 C 代码 ， 和 Python 相关 的 代码 分 开放 。 一 上段 在 上 面 ， 一段 在 下 面 。 E 
这 样 可 以 让 代码 更 具 可 读 性 。 对 于 小 程序 来 说 ， 没 有 任何 问题 。 但 在 实际 应 用 中 ， 源 代码 会 越 


写 越 大 。 一 部 分 人 就 会 考虑 把 他 们 的 包装 函数 放 在 男 一 个 源 文件 中 。 起 个 诸如 ExtestWrappers.c 之 
类 好 记 的 名 字 。 








22. 2.5 引用 计数 


也 许 你 还 记得 ，Python 使 用 引用 计数 作为 跟踪 一 个 对 象 是 否 不 再 被 使 用 ， 所 占 内 存 是 否 应 该 被 
回收 的 手段 。 它 是 垃圾 回收 机 制 的 一 部 分 。 当 创建 扩展 时 ， 你 必需 对 如 何 操作 Python 对 象 要 格外 的 
小 心 。 你 时 时 刻 刻 都 要 注意 是 否 要 改变 某 个 对 象 的 引用 计数 。 




















一 个 对 象 可 能 有 两 类 引用 。 一 种 是 拥有 引用 ， 你 要 对 这 个 对 象 的 引用 计数 加 1， 以 表示 你 也 拥有 
这 个 对 象 的 所 有 权 。 如 果 这 个 Python 对 象 是 你 自己 创建 的 , 那 这 时 , 你 肯定 拥有 这 个 对 象 的 所 有 权 。 


























当 你 不 再 需要 一 个 Python 对 象 时 ， 你 必须 要 交 出 你 的 所 有 权 ， 要 么 把 引用 计数 减 1， 要 么 把 所 
有 权 交 给 别人 ， 要 么 把 这 个 对 象 存 到 其 它 的 容器 中 (tuple, list 等 ) 。 没 有 交 出 所 有 权 就 会 导致 内 存 
泄露 。 











你 也 可 以 拥有 对 象 的 借 引 用 。 相 对 来 说 ， 这 种 方式 的 责任 就 小 一 些 。 除 非 是 别人 在 外 面 把 对 象 
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传递 给 你 。 和 否则 ， 不 要 用 任何 方式 修改 对 象 里 的 数据 。 你 也 不 用 时 刻 考 虑 对 象 引用 计数 的 问题 ， 只 
要 你 不 会 在 对 象 的 引用 计数 减 为 0 之 后 再 去 使 用 这 个 对 象 。 你 也 可 以 把 借 引 用 对 象 的 引用 的 数量 加 1， 
从 而 真正 的 引用 这 个 对 象 。 














例 22.3 C 库 的 Python 包装 版 本 (Extest2. c) 


7 #include <stdio. h^ 

2 #include <stdlib. h> 
3 Zinclude <string. ID 
4 

5 int fac(int n) 

6 7 

7 if Q < 2) rseturmctt/z 
8 return (n)*fac(n-1); 


9} 
10 
11 char *reverse(char *s) 
72 { 
13 register char t, 
14 *p = s, 
15 *q = (s + (strlen(s) - 1); 
16 
17 while (s && (p < q)) 
18 ( 
19 t = Xp; 
20 *ptt = xq; 
21 *q-— = t; 
22 } 
23 return s; 
24 ] 
25 
26 int test 
«I 


28 char sÍBUFSIZJ/; 

29 printf (4! == %d\n*, fac); 

30 printf( 8! == %d\n’*, fac(8)); 

31 printf 12! = Wdin', fae(12)); 

32 stropy(s, 'abcdef^); 

33 printf (“reversing 'abcdef', we get 'Ws'|n^, | 
34 reverse(s)); 





$— 一 * 一 
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35 strepy(s, madam’) ; 





^ | 


36 printf (reversing 'madam , we get 'fWs'|n^, 
37 reverse(s)); 
36 return 0; 
39 ] 
40 
41 #include “Python. h^ 
42 
43 static PyObject * 
44 Extest fac(PyObject *self, PyObject *args) 
45 ( 
46 int num; 
47 if (!PyArg ParseTuple(args, ^i^, &num)) 
48 return NULL; 
49 return (PyObject*)Py BuildValue( i^, fac (num));/ 
80.7 
51 
52 static PyObject * 
53 Extest doppel(PyObject *self, PyObject *args) 
54 ( 
55 char *orig str; 
56 char *dupe str; 
87 PyObject* retval; 
38 
59 if (!PyArg ParseTuple(args, “s”, korig str)) 
60 return NULL; 
61 retval = (PyObject*)Py BuildValue(ss^, orig str, | 
62 dupe str-reverse(strdup(orig str))); 
63 free(dupe str); 
64 return retval; 
65 ] 
66 
67 static PyObject * 
68 Extest test (PyObject *self, PyObject *args) 
69 ( 
70 test Q; 
71 return (PyObject*)Py BuildValue( ^); 
72 } 
73 
74 static PyMethodDef 
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75 ExtestMethods[] = 

76 { 

77 ( “fac”, Extest fac, METH VARARGS }, 
78 { *doppel^, Extest doppel, METH VARARGS }, 
79 { “test”, Extest test, METH VARARGS /, 
80 { NULL, NULL }, 

8l }; 

82 

83 void initExtest () 

84 ( 

85 Py InitModule(CExtest/^, ExtestMethods); 
86 ] 


Python 提供 了 一 对 C 的 宏 ， 可 以 用 来 改变 Python 对 象 的 引用 计数 。 见 表 22.3. 





在 上 面 的 Extest_test O 函数 中 ， 我 们 创建 了 一 个 空 字 符 串 的 PyObject 对 象 ， 用 以 返回 None. 
或 者 ， 你 也 可 以 对 空 对 象 PyNone) 的 引用 计数 加 1, KA PyNone 的 拥有 者 ， 然 后 直接 返回 


PyNone。 见 下 例 ; 
表 22. 3 用 于 Python 对 象 引 用 计数 的 宏 
函数 说 明 


Py INCREF(obj) 增加 对 象 obj 的 引用 计数 
Py DECREF(obj) 减少 对 象 obj 的 引用 计数 





static PyObject * 

Extest_test (PyObject *self, PyObject *args) 
test(); 
Py_INCREF (Py_None) ; 
return PyNone; 


} 


Py INCREF () 41 Py_DECREF O 两 个 函数 也 有 一 个 先 检查 对 象 是 
和 Py XDECREF () 。 


我 们 强烈 建议 读者 阅读 Python 文档 的 扩展 和 嵌入 Python 部 分 中 关于 引用 计数 的 内 容 。( 见 附录 
中 的 文档 参考 部 分 ) 





22.2.6 线程 和 全 局 解释 锁 CGIL) 





编译 扩展 的 人 必须 要 注意 ， 他 们 的 代码 有 可 能 会 被 运 








人 否 为 空 的 版 本 , 分 


行 在 一 个 多 线程 的 Python 环境 中 。 早 在 
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别 为 Py XINCREF () 
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18. 3. 1 节 , 我 们 就 介绍 了 Python 虚拟 机 (PVM) 和 全 局 解释 锁 (GIL) 。 并 描述 了 , 在 PVM 中 , 任何 时 候 ， 
同时 只 会 有 一 个 线程 被 运行 。 其 它 线程 会 被 GIL 停 下 来 。 而 且 ， 我 们 指出 调用 扩展 代码 等 外 部 函数 
时 ， 代 码 会 被 6IL 锁 住 ， 直 到 函数 返回 为 止 。 

















前 面 ， 我们 也 提 到 过 一 种 折 训 方案 ， 可 以 让 编写 扩展 的 程序 员 释 放 GIL， 例 如 在 系统 调用 前 就 可 
以 做 到 。 这 是 通过 将 您 的 代码 和 线程 隔离 实现 的 ， 这 些 线程 使 用 了 另外 的 两 个 C K 
Py BEGIN ALLOW THREADS 和 Py END ALLOW THREADS 保证 了 运行 和 非 运行 时 的 安全 性 。 由 这 些 宏 包 囊 
的 代码 将 会 允许 其 他 线程 的 运行 。 




















同 引 用 计数 宏一 样 ， 我 们 强烈 建议 你 好 好 看 看 关于 扩展 和 肉 入 Python 的 文档 以 及 Python/C API 
参考 手册 。 


22. 3 相关 话题 


SWIG 
有 一 个 外 部 工具 叫 SWIG, Æ Simplified Wrapper and Interface Generator 的 缩写 。 其 作者 为 
David Beazley， 同 时 也 是 Python Essential Referenc 一 书 的 作者 。 这 个 工具 可 以 根据 特别 注释 过 
的 C/C++ 头 文件 生成 能 给 Python, Tcl 和 Perl 使 用 的 包装 代码 。 使 用 SWIG 可 以 省 去 你 写 前 面 所 说 
的 样板 代码 的 时 间 。 你 只 要 关心 怎么 用 C/C++ 解决 你 的 实际 问题 就 好 了 。 你 所 要 做 的 就 是 按 SWIG 的 























格式 编写 文件 ， 其 余 的 就 都 由 SWIG 来 完成 。 你 可 以 通过 下 面 的 网 址 找到 关于 SWIG 的 更 多 信息 。 
http://swig. org 


Pyrex 

创建 C/C++ 扩展 的 一 个 很 明显 的 坏处 是 你 必须 要 写 C/C++ 代码 。 你 能 利用 它们 的 优点 ， 但 更 重要 
的 是 ， 你 也 会 碰 到 它们 的 缺点 。Pyrex 可 以 让 你 只 取 扩 展 的 优点 ， 而 完全 没有 后 顾 之 忧 。 它 是 一 种 更 
偏向 Python Bj C 语言 和 Python 语言 的 混合 语言 。 事 实 上 ，Pyrex 的 官方 网 站 上 就 说 “Pyrex 是 具有 
C 数据 类 型 的 Python “. 你 只 要 用 Pyrex 的 语法 写 代码 , 然后 运行 Pyrex 编译 器 去 编译 源 代 码 。Pyrex 
会 生成 相应 的 C 代码 ， 这 些 代码 可 以 被 编译 成 普通 的 扩展 。 你 可 以 在 它 的 官方 网 站 下 载 到 Pyrex: 









































http://cosc. canterbury. ac. nz/ greg/python/Pyrex 


Psyco 

Pyrex 免 去 了 我 们 再 去 写 纯 C 代码 的 麻烦 ,不 过 , 你 要 去 学 会 它 的 那 一 套 与 众 不 同 的 语法 。 最 后 ， 
你 的 Pyrex 代码 还 是 会 被 转 成 C 的 代码 。 无 论 你 用 C/C++，C/C++ 加 上 SWIG， 还 是 Pyrex， 都 是 因为 
你 想 要 加 快 你 的 程序 的 速度 。 如 果 你 可 以 在 不 改动 你 的 Python 代码 的 同时 ， 又 能 获得 速度 的 提升 ， 
那 该 多 好 啊 。 

Psyco 的 理念 与 其 它 的 方法 截然 不 同 。 与 其 改 成 C 的 代码 ， 为 何不 让 你 已 有 的 Python 代码 

运行 的 更 快 一 些 呢 ? 
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Psyco 是 一 个 just-in-time (JIT) 编译 器 , 它 能 在 运行 时 自动 把 字 节 码 转 为 本 地 代码 运行 .所 以 ， 
你 只 要 在 运行 时 ) 导入 Psyco 模块 ， 然 后 告诉 它 要 开始 优化 代码 就 可 以 了 。 而 不 用 修改 自己 的 代 
码 。 

Psyco 也 可 以 检查 你 代码 各 个 部 分 的 运行 时 间 ， 以 找 出 瓶 锯 所在。 你 甚至 可 以 打开 日 志 功 能 ,来 
查看 Psyco 在 优化 你 的 代码 的 时 候 ， 都 做 了 些 什 么 。 你 可 以 访问 以 下 网 站 获取 更 多 的 信息 : 

http://psyco. sf. net 




















PA 

fkKA dE Python 的 另 一 功能 。 与 把 C 代码 包装 到 Python HANA EATEN, BEN ETE Python 解释 
器 包装 到 C 的 程序 中 。 这 样 做 可 以 给 大 型 的 ， 单 一 的 ， 要 求 严格 的 ， 私 有 的 并 且 (或 者 ) 极其 重要 
的 应 用 程序 内 骨 Python 解释 器 的 能 力 。 一 旦 内 典 了 Python， 世 界 完全 不 一 样 了 。 

Python 提供 了 很 多 官方 文档 供 写 扩展 的 人 参考 。 

下 面 是 一 些 与 本 章 相关 的 Python 文档 : 

扩展 与 嵌入 

http://docs. python. org/ext 

Python/C API 

http: //docs. python. org/api 

分 发 Python 模块 


http://docs. python. org/dist 


$ 22.4 练习 * 


22-1. 扩展 Python. 编写 Python 扩展 都 有 些 什 么 好 处 ? 


























22-2. 扩展 Python， 编 写 Python 扩展 都 有 些 什 么 不 好 的 地 方 或 是 危险 的 地 方 ? 





22-3. jt He. 下 载 或 找到 一 个 C/C++ 编译 器 ， 并 写 一 个 小 程序 (重新 ) 熟 悉 一 下 C/C++ 
编程 。 找 到 你 的 Python 所 在 的 目录 ， 并 找到 Misc/Makefile. pre. in 文件 。 把 你 刚 写 的 

程序 包装 到 Python 当中 。 按 步骤 把 你 的 模块 编译 成 动态 库 ， 从 Python 中 调用 你 的 模块 并 
测试 一 下 是 否 正确 。 














22-4， 把 Python 移植 到 C。 选 几 个 你 在 前 几 章 写 的 代码 ， 并 把 它们 做 为 模块 移植 到 C/C++ 
中 。 





22-5. 包装 C 代码 。 找 一 段 你 之 前 写 的 ， 想 移植 到 Python 的 C/C++ 代码 。 不 要 去 移植 ， 
把 这 段 代 码 改 成 扩展 模块 。 


22-6. 编写 扩展 。 在 13-3 的 练习 中 ， 你 写 了 一 个 dollarize () 函数 ， 它 能 把 浮 点 数 转 为 
前 置 美 元 符号 ， 喜 号 分 隔 的 货币 金额 字符 串 。 请 创建 一 个 扩展 ， 包 装 dollarizeO MH, 
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并 在 模块 中 增加 一 个 回归 测试 函数 test 0 。 附 加 题 : 除了 创建 C 扩展 外 ， 再 用 Pyrex BS 
dollarize() 函数 。 


22-7. 扩展 和 迭 入 。 扩 展 和 肉 入 的 区 别 是 什么 ? 
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Web 服务 

FA Win32 的 COM 来 操作 Microsoft Office 
用 Jython 5j Python 和 Java 的 程序 

练习 
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本 章 将 简单 介绍 一 下 有 关 Python 编程 一 些 杂 项 ， 很 可 惜 ， 我 们 没有 足够 的 时 间 来 更 深入 的 探讨 
这 些 主题 。 希 望 在 本 书 的 下 一 版 中 ， 将 每 个 相关 主题 单列 一 章 


























23. 1 Web 服务 
在 网 络 上 ， 有 大 量 的 Web 服务 和 应 用 ， 它 们 提供 各 式 各 样 的 服务 。 您 会 发 现 多 数 大 型 服务 部 $ 























会 提供 《其 服务 的 ) 应 用 程序 接口 (API) ， 比 如 Yahoo!. Google. eBay 和 Amazon 等 车 过 去 ， 
API 
仅仅 被 用 来 访问 使 用 这 些 服务 的 数据 , 但 是 今天 的 API 已 经 不 同 , 它们 不 但 丰富 而 且 功能 齐全 ， 


而 且 您 可 以 将 这 些 Web 服务 整合 到 您 自己 的 个 人 网 站 和 网 页 中 ， 这 通常 被 称 作 “Mash-ups. " 








这 是 一 些 很 有 意思 的 功能 ， 但 是 ， 暂 时 我 们 只 简单 的 尝试 一 个 很 有 用 ， 同 时 提供 时 间 也 比较 长 
的 服务 ， BI Yahoo! fé i 的 股票 报价 服务 。 其 网 址 是 http://finance. yahoo. com. 




















23.1.1 Yahoo! 金 融 股票 报价 服务 器 





如 果 您 访问 下 面 的 网 站 查询 某 支 股票 的 价格 ， 您 会 在 标 了 “Download Data” 的 基本 报价 那里 看 





到 








一 个 连接 。 这 个 连接 允许 你 下 载 一 个 可 以 导入 Microsoft Excel 和 Intuit Quicken 的 CSV 格式 
的 文件 。 


http://finance. yahoo. com/d/quotes. csv?s-GOOG&f-sl1dltlclohgv&e-. csv 
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ee 0 
让 用 户 下 载 CSV 文件 


如 果 浏 览 器 的 MIME 的 设置 正确 的 话 ， 你 的 浏览 器 将 局 动 Excel 打开 下 载 好 的 文件 。 这 主要 是 
因为 连接 中 包含 了 e=. csv 的 设置 。 这 样 的 设置 将 使 server 返回 CSV 格式 的 结果 。 





























如 果 我 们 使 用 urllib. urlopen () 来 得 到 报价 ， 会 得 到 一 行 CSV 格式 的 返回 结果 : 


2225 from urllib import urlopen 
2» u = urlopen( http://quote. yahoo. com/d/quotes. csv?s-VIIO0&f-sl1dIt1clohgv!) 
222 for row in u: 


print row 


' ^VHOO^, 30. 76, ^5/23/20067, ^4:00pm^, +0. 30, 31. 07, 31. 63, 30. 76, 28594020 |r|n* 
22» £ close () 


fax n] VAP LR TRIBU ETE CSL RNAS, AE SET OE). suu Ay ME 
用 Python2. 3 版 本 新 加 入 的 csv 模块 。 这 个 模块 自动 完成 字符 串 分 割 和 去 掉头 尾 的 空白 字符 的 功能 。 
使 用 csv 的 话 ， 我 们 就 可 以 其 它 的 代码 不 变 ， 把 上 面 的 那个 for 循环 改 为 : 








222 Import csv 
2 for row in csv. reader (u): 
print row 


['YHOO', '30. 767, '5/23/2006', '4:00pm', ° +0. 30’, 
'81.07, '31.637, 30 767, '28594020' ] 


分 析 传 递 给 server Hy f 参数 并 看 了 Yahoo! 的 这 个 服务 的 在 线 帮 助 后 ， 我 们 可 以 知道 ， 符 号 
slldltlclohgv 对 应 着 : 订单 号 ， 最 后 的 价格 ， 日 期 ， 时 间 ， 变 化 量 ， 开 盘 价 ， 当 日 最 高 ， 当 日 最 低 
和 成 交 量 。 








您 可 以 通过 访问 Yahoo! Finance 帮助 页 面 获 得 更 多 的 信息 -一 只 要 搜索 “download data” aK 
“download spreadsheet format” 就 可 以 了 。 


深入 的 分 析 这 个 API， 我 们 可 以 得 到 更 多 的 信息 ， 如 : 上 一 次 收盘 价 ，52 周 的 最 高 和 最 低 价 等 
总 而 言 之 ， 表 23. 1 列 出 了 返回 数据 的 格式 。 











每 一 段 的 名 字 按 你 想 要 的 数据 的 顺序 排列 。 只 要 把 它们 连接 在 一 起 整个 做 为 参数 f， 加 到 请 求 
URL 中 。 


E 


K 23.1 Yahoo! Finance 股票 报价 服务 器 参数 
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Field 
Stock Quotation Data Name? Format Returned 
Stock ticker symbol s "YHOO" 
Price of last trade 11 328 
Last trade date di "2/2/2000" 
Time of last trade t1 "4:00pm" 
Change from previous close c1 +10.625 
Percentage change from previous close p2 "43.35%" 
Previous closing price p 317.375 
Last opening price o 321.484375 
Daily high price h 337 
Daily low price g 317 
52-week range w *110 - 500.125" 
Volume for the day v 6703300 
Market capitalization ji 86.343B 
Earnings per share 一 0.20 
Price-to-earnings ratio r 1586.88 
Company name n "YAHOO INC" 


a， 字 段 名 的 第 一 个 字符 是 一 个 字母 ， 第 二 个 字符 《如果 有 的 话 ) 是 数字 
b. 有 一 些 值 是 用 双 引 号 引起 来 的 。 


有 些 返 回 结果 是 用 引号 引起 来 的 。 解 析 代 码 要 能 正确 的 解析 这 些 数据 。 观 察 上 面 手工 解析 返回 
字符 串 和 用 csv 模块 解析 返回 字符 串 所 得 到 的 结果 。 如 果 某 个 值 不 存在 ， 报 价 服务 器 会 返回 “N/A“ 


例如 ， 如 果 我 们 给 服务 器 的 f 字段 为 f=slldlclp2， 我 们 会 得 到 如 下 的 字符 串 : 
^VHOO^, 166. 203125, ^2/23/2000^, +12, 890625, “+8. 06%” 


如 果 是 不 公开 交易 的 股票 ， 我 们 会 得 到 如 下 的 结果 注意 ， 不 少 列 都 是 双 引 号 引起 来 的 ， 包 括 
N/A): 


“PBLS. OB’, 0. 00, “N/A”, N/A, “N/A” 


e 
* 





+- aa + 
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报价 服务 器 也 支持 同时 指定 多 支 股 票 ， 如 s-YHOO, GOOG, EBAY, AMZN. 返回 的 结果 是 每 支 股 票 信息 
占 一 行 。 要 记 住 Yahoo! Finance 帮助 页 面 所 说 的 : 任何 把 Yahoo! 显 示 的 数据 再 次 发 布 的 行为 都 是 严 
格 禁 止 的 。 所 以 ， 你 只 能 把 这 些 信息 用 于 私人 用 途 。 同 时 也 要 记 住 ， 所 有 你 得 到 的 数据 ， 都 是 有 一 
定 延 时 的 。 用 我 们 已 有 的 知识 ， 我 们 可 以 实现 一 个 应 用 程序 ( 例 23.1), ， 用 于 读 取 并 显示 一 些 我 们 关 
心 的 互连网 公司 的 股票 报价 信息 。 





























例 23. 1 Yahoo! Finance 股票 报价 例子 (stock. py) 
这 个 脚本 能 从 Yahoo! 报 价 服 务 器 下 载 并 显示 股票 的 价格 。 


Ig!/usr/bin/env python 
2 
3from time import ctime 
4from urllib import urlopen 
5 
6ticks = ( YHOO’, 'GO0G', 'EBAY', 'AMZW') 
7URL = 'http://quote. yahoo. com/d/quotes. csv?s-fis&f-slI1clpZ" 
8 
9 print '|nPrices quoted as of:', ctime() 
10 print '|nTICKER'. 1just (9), °’ PRICE. just (8), 'CHG'. ljust (5), ' GAGE’ 


i print “一 一 一 "d MEQUE “一 一 一 ”. Ljust (8), e ast), Tm" 
12 u = urlopen(URL % ', '. join(ticks)) 
13 


i4 for row in u: 

15 tick, price, chg, per = row. split(, ’) 

16 print eval (tick). Ljust (7), | 

17 (C 2f' % round(float(price), 2)).rjust(6), | 
18  chg.rjust(6), eval (per. rstrip()). r just (6) 

19 

20 u.close() 
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如 果 我 们 执行 这 个 脚本 ， 会 得 到 如 下 的 输出 : 


$ stock.py 


Prices quoted as of: Sat May 27 03:25:56 2006 


TICKER PRICE CHG SAGE 
YHOO 33.02 +0.10 +0.30% 
GOOG 381.35 -1.64 -0.43% 
EBAY 34.20 +0.32 +0.94% 
AMZN 36.07 +0.44 +1.23% 


23.2 FA Win32 的 COM 来 操作 Microsoft Office 








在 你 日 常 工作 环境 中 所 能 做 的 最 有 用 的 事情 之 一 就 是 集成 对 Win32 程序 的 支持 。 实 现 从 这 样 的 
应 用 程序 中 读 写 数据 是 很 容易 的 事 。 虽 然 你 所 在 的 部 分 可 能 用 不 着 Win32 环境 ， 但 很 有 可 能 你 的 经 
理 或 是 其 它 的 工程 组 在 用 。Mark Hammond 的 Python 的 Windows 扩展 使 得 程序 员 可 以 在 本 地 环境 直接 
与 Win32 程序 进行 交互 。( 该 扩展 可 以 在 本 书 的 网 站 上 下 载 ) 
































Win32 编程 是 一 个 相当 广泛 的 概念 .Python 的 Windows 扩展 包 包含 了 其 中 的 大 部 分 。 如 :Windows 
s API, 3tf&, Microsoft Foundation Classes (MFC) 图 形 界面 接口 (GUD FR, Windows 多 线程 开 E 
发 ， 服 务 ， 远 程 访问 ， 管 道 ，COM 服务 端 编程 以 及 事件 。 还 有 一 个 能 在 . NET/Mono 开发 环境 中 使 用 
的 Python 语言 的 C# 实 现 : IronPython。 在 本 节 ， 我 们 主要 关注 Win32 程序 设计 的 一 部 分 一 客户 端 
COM 编程 ， 它 有 着 相当 广泛 的 实际 用 途 。 














23.2.1 客户 端 COM 编程 


我 们 可 以 使 用 组 件 对 象 模 型 ， 另 一 个 比较 熟悉 的 名 字 是 COM (市 场 化 的 名 字 是 ActiveX) 来 与 诸 
如 Outlook 和 Excel 之 类 的 工具 进行 通讯 。 对 于 程序 员 来 说 ， 能 在 Python 代码 中 ， 直 接 控制 一 个 本 
地 Office 应 用 程序 是 一 件 很 快乐 的 事情 。 

















特别 地 ， 当 说 到 使 用 一 个 COM 对 象 时 ， 即 启动 一 个 应 用 程序 ， 并 允许 代码 访问 该 应 用 程序 提供 
的 方法 ， 被 称 为 是 客户 端的 COM 编程 。 当 你 实现 一 个 COM 对 象 ， 供 其 它 客户 端 调 用 则 被 称 为 是 服务 
端的 COM 编程 。 


核心 笔记 Python 5 Microsoft COM( 客 户 端 ) 编 程 

在 Windows 32 位 平台 上 ，Python 5j COM 是 可 以 相互 操作 的 。COM 是 微软 的 一 种 接口 技术 ， 它 定 
义 了 语言 及 格式 无 关 的 对 象 与 对 象 之 间或 是 更 高 层次 的 应 用 程序 与 应 用 程序 之 间 的 通讯 。 本 节 中 ， 
我 们 将 看 来 如 何 把 Python 与 COM (客户 端 编程 ) 组合 起 来 ， 与 Microsoft Office 的 应 用 程序 如 Word, 
Excel, PowerPoint 和 Outlook 之 间 进 行 通 讯 。 
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本 节 的 先决 条 件 是 要 运行 在 Win32 平台 上 ， 并 且 安 装 了 Python 和 Python 的 Windows 扩展 。 同 
时 ， 必 需要 安装 一 个 或 多 个 例子 中 用 到 的 Microsoft 应 用 程序 。Python 的 Windows 扩展 的 下 载 说 明 
很 容易 看 懂 ， 照 着 做 一 般 不 会 出 问题 。 我 们 推荐 用 扩展 自 带 的 PythonWin 做 为 创建 和 测试 你 Win32 
脚本 的 IDE。 




















在 本 节 中 ， 我 们 将 演示 如 何 与 0ffice 应 用 程序 进行 交互 。 我 们 将 给 出 几 个 示例 ， 并 详细 解释 它 
们 。 其 中 有 一 些 例子 是 非常 实用 的 。 你 也 能 在 ““Python Cookbook“ 网 站 找到 一 部 分 例子 。 必 需要 
承认 的 是 ， 我 们 并 不 是 COM 或 是 Visual Basic 的 专家 ， 同 时 ， 我 们 也 知道 ， 这 些 例子 还 有 很 大 的 可 
以 改进 的 空间 。 我 们 强烈 希望 所 有 读者 把 您 认为 对 大 家 有 用 的 评论 ， 建 议 或 改进 发 给 我 们 。 
































我 们 先 从 很 简单 的 Microsoft Excel, Word, PowerPoint, Outlook 的 启动 和 交互 开始 。 在 展示 
例子 之 前 ， 我 们 要 先 指 出 ， 客 户 端 COM 应 用 程序 运行 时 都 遵循 相同 的 几 个 步 又。 与 这 些 应 用 程序 进 
行 交 互 的 典型 的 方法 是 这 样 的 : 











l. 启动 应 用 程序 

2. 打开 要 编辑 的 文档 

3， 显 示 应 用 程序 (如 果 有 必要 的 话 ) 
4. 对 文档 做 一 定 的 操作 


5. 保存 或 放弃 文档 
6， 退 出 


说 的 够 多 了 , 下面， 开始 看 一 些 代 码 吧 。 以 下 是 一 系列 脚本 ， 用 于 控制 不 同 的 微软 的 应 用 程序 。 
这 些 脚 本 都 导入 了 win32com. client 模块 和 一 些 Tk 模块 来 控制 各 个 应 用 程序 的 启动 (和 其 它 操作 )。 
同 第 19 章 一 样 ， 我 们 采用 . pyw 后 级 来 避免 不 必要 的 DOS 命令 窗口 。 























23.2.2 微软 Excel 


我 们 的 第 一 个 例子 演示 如 何 使 用 Excel。 在 整个 的 0ffice 系列 软件 中 ， 我 们 发 现 Excel 是 最 可 
编程 的 。 用 Excel 处 理 数 据 非 常 的 有 用 ， 一 方面 可 以 利用 电子 表格 的 功能 优势 ， 另 一 方面 可 以 用 非 
常 好 的 打印 格式 来 查看 数据 。 而 且 可 以 从 电子 表格 中 读 取 数据 ， 然 后 使 用 像 Python 这 样 的 编程 语言 
来 处 理 处 理 数据 ， 这 一 点 也 非常 有 用 。 在 这 一 部 分 的 最 后 我 们 会 给 出 一 个 使 用 Excel 的 更 加 复杂 一 
点 的 例子 ， 但 是 我 们 总 得 开始 吧 ， 所 以 我 们 先 从 例 23. 2 开始 。 















































例 23. 2 Excel 例子 (excel. pyw) 
这 个 脚本 启动 Excel， 然 后 将 数据 填 到 电子 表格 的 空格 中 。 
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Z!/usr/bin/env python 


from Tkinter import Tk 

from time import sleep 

from tkMessageDox import showwarning 
import win32com. client as win32 


warn = lambda app: showwarning (app, 'Exit?') 
RANGE = range(3, 8) 


SAN Y S n o NSS 
人 


10 

11 def excel Q: 

I2 app = ° Excel’ 

13 xl = win82. gencache. EnsureDispatch( %s. Application’ % app) 
14 ss = xl. Workbooks. Add Ol) 

15 sh = ss. ActiveSheet 

16 xl. Visible = True 

17  sleep(1) 

18 


19 sh. Cells (1, 1). Value = ’Python-to-—%s Demo’ % app 

20 sleep (1) 

21 for i in RANGE: 

22 sh. Cells(i, 1). Value = 'Line %d’ % i 
23 sleep (1) 
24 sh. Cells (it2, 1). Value = ^Th-th-th-that's all folks!” 
25 
26 warn (app) 
27 ss. Close (False) 
28 xl. Application. Quit Q 





29 

30 if name --' main 
31 | TkO. withdraw 

32 excel 

逐 行 解释 

1-6, 3147 


我 们 导入 Tkinter 和 tkMessageBox 模块 只 是 为 了 使 用 showwarning 消息 框 来 终止 演示 。 在 显示 
对 话 框 ( 行 26) 之 前 ， 我 们 调用 withdraw( 函数 先 绘 出 Tk 最 顶层 的 窗口 ( 行 31)。 如 果 您 不 首先 初 


























始 化 顶层 窗口 ， 系 统 会 自动 地 为 您 创建 一 个 ， 不 过 ， 自 动 创建 的 不 会 自动 关闭 ， 会 很 讨厌 的 显示 在 
屏幕 上 。 
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11-1747 

当代 码 启 动 GU FH) Excel 后 ， 我 们 添加 了 一 个 工作 短 (就 是 包含 了 多 个 可 以 写 数据 的 工作 表 的 
电子 表格 ) 。 并 得 到 了 正在 显示 的 活动 表格 的 句柄 。 不 要 在 术语 上 花 太 多 精力 ， 因 为 ,“ 工 作 短 包含 
好 几 个 工作 表 ” 这 种 话 很 容易 使 人 迷惑 。 

















核心 笔记 : 静态 和 动态 调用 

在 第 13 行 ， 我 们 使 用 的 是 静态 调用 。 在 运行 这 个 脚本 之 前 ， 我 们 从 PythonWin 中 运行 Makepy 
工具 〈 启 动 IDE， 选 择 Tools 一 > COM Makepy 工具 ， 然 后 选择 相应 的 应 用 程序 库 )， 这 个 工具 创建 并 
缓存 应 用 程序 需要 的 对 象 。 没 有 这 些 预 先 准 备 工 作 ， 对 象 和 属性 得 在 运行 时 建立 。 如 果 是 在 运行 时 
创建 对 象 和 属性 ， 那 么 就 叫做 动态 调用 。 如 果 您 想 动 态 运行 ， 那 么 请 使 用 常用 的 Dispatch O 函数 。 

xl = winóZcom. client. Dispatch( %s. Application’ % app) 








Visible 标记 必须 设 为 True， 这 样 才 可 以 让 应 用 程序 显示 在 桌面 上 ， 然 后 停 下 来 ， 这 样 用 户 可 
以 看 到 演示 的 每 一 步 ( 行 16) 。 要 知道 第 17 行 sleep 0 〇 调用 的 含义 ， 请 阅读 接 下 来 的 内 容 。 





19 - 24 1T 

在 这 个 脚本 程序 的 应 用 部 分 Capplication portion)， 我 们 把 这 个 演示 的 标题 写 到 了 左上 角 的 
第 一 格 ， 也 就 是 人 Al) 或 (1，1) ， 然 后 跳 过 了 一 行 ， 把 “Line N” 写 到 相应 的 格 中 , N 是 从 3 到 7 的 
数字 。 在 写 每 一 行 的 时 候 中 间 停 顿 1 秒 ， 这 样 您 就 可 以 看 到 演示 过 程 了 《如 果 没 有 延迟 ， 写 每 一 行 














的 过 程 会 非常 的 快 )。 


26 - 32 行 

在 演示 结束 的 时 候 ， 会 弹出 一 个 消息 对 话 框 ， 以 方便 用 户 在 看 完 输出 后 ， 结 束 演示 程序 。 电 子 
表格 关闭 时 不 会 被 保存 ， 首 先 调用 ss. Close([SaveChanges=]False) ， 然 后 应 用 程序 结束 。 最 后 ， 脚 
本 的 “main” 部 分 只 是 初始 化 Tk， 然后 执行 应 用 程序 的 核心 部 分 。 运 行 这 个 脚本 程序 ， 会 弹出 一 个 
Excel 应 用 程序 窗口 ， 如 图 23 - 1 所 示 。 




















23.2.3 微软 Word 





下 面 来 演示 一 下 如 何 使 用 Word。 由 于 涉及 到 的 数据 不 多 ， 用 Word 写 文档 的 可 编程 性 就 不 是 那么 
强 了 。 你 可 以 考虑 用 Word 来 自动 生成 格式 化 的 信件 等 。 不过, 在 例 23. 3 中 ,我 们 将 创建 一 个 文档 ， 
然后 简单 的 写 几 行 字 。 
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23-1] Python-to-Excel demonstration script (excel. pyw) 


Example 23.3 Word Example (word. pyw) 
这 个 脚本 启动 Word， 然 后 向 文档 中 写 数据 。 


1 #!/usr/bin/env python 


from Tkinter import Tk 
from time import sleep 
from tkMessageBox import showwarning 


3 

4 

5 

6 import winóZcom.client as win32 

7 

8 warn = lambda app: showwarning(app, ' Exit?) 
9 RANGE = range(3, 8) 

11 def word: 

12 app = 'Word' 

13 word = win32. gencache. EnsureDispatch( %s. Application’ % app) 
14 doc = word. Documents. Add () 

15 word. Visible = True 

16 sleep) 


17 
18 rng = doc. Range (0, 0) 
19 rng. InsertAfter( Python-to-%s Test\r\n\r\n? % app) //Check codes here 


20 sleep (1) 





* 
aa +e 
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21 for i in RANGE: 

22  rng.InsertAfter( Line %d\r\n’ % i) 

23  sleep(1) 

24  rng.InsertAfter(C |r|nTh-th-th-that's all folks!|r|n?) 
25 

26 warn (app) 

27 doc. Close (False) 

28 word. Application. Quit () 








29 

30 if name == main 
31  TkO.withdrawQ 

32  word( 





这 个 Word 的 例子 和 上 面 的 Excel 例子 非常 的 相似 ， 唯 一 的 不 同 是 我 们 得 在 文档 “范围 ”内 插入 
字符 串 ， 每 写 一 次 得 向 前 移动 一 下 光标 ， 而 不 是 像 在 Excel 中 那样 ， 得 写 在 每 一 格 中 。 我 们 还 得 在 
程序 中 写 明 行 结束 符 ， 也 就 是 回 车 换行 (\rN\n) 。 

如 果 我 们 执行 这 个 脚本 程序 ， 会 显示 如 图 23 - 2 的 界面 。 


$ stock.py 


Prices quoted as of: Sat May 27 03:25:56 2006 
TICKER PRICE CHG SAGE 


YHOO 33.02 +0.10 +0.30% 

















GOOG 381.35 -1.64 -0.43% 
EBAY 34.20 +0.32 +0.94% 
AMZN 36.07 +0.44 +1.23% 


图 23 -2 Python-to-Word demonstration script (word. pyw) 


23.2. 4 微软 PowerPoint 





在 应 用 程序 中 使 用 PowerPoint 并 不 太 常见 ， 但 是 当 您 急于 制作 演示 文稿 的 时 候 可 能 会 考虑 使 用 
它 。 您 可 以 在 飞机 上 用 文本 文件 写 下 核心 内 容 ， 然 后 在 抵达 酒店 的 夜里 用 脚本 程序 处 理 这 个 文件 来 
自动 生成 一 系列 的 约 灯 片 。 您 甚至 可 以 通过 添加 背景 和 动画 等 东西 来 增强 效果 ， 这 些 都 可 以 通过 COM 
接口 做 到 。 另 外 一 个 使 用 到 的 情况 就 是 当 您 不 得 不 自动 生成 或 修改 新 的 或 已 存在 的 演示 文档 的 时 候 。 
您 可 以 通过 shell 脚本 程序 控制 COM 脚本 来 创建 来 创建 或 者 调整 每 个 生成 的 约 灯 片 。 好 了 ， 太 多 的 
AE een 。 现 在 来 看 一 下 我 们 的 PowerPoint 例子 ， 如 例 23. 4 所 示 。 






































您 会 再 一 次 注意 到 这 个 例子 和 上 面 的 Excel 和 Word 演示 非常 的 相似 。 PowerPoint 的 不 同 之 处 在 
于 您 写 入 数据 的 对 象 不 一 样 了 。 不 是 癌 单 独 的 表格 或 文档 中 写 入 数据 ，PowerPoint 更 为 复杂 ， 因 为 
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* 
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每 一 张 幻 灯 片 可 以 有 不 同 的 布局 。 在 一 个 演示 文档 中 ， 您 有 多 张 幻 灯 片 ， 其 中 每 一 张 幻灯 片 可 以 有 
不 同 的 布局 。 (最 新 版 本 的 PowerPoint 有 30 种 不 同 的 布局 。) 你 可 以 进行 的 操作 依 您 所 选 的 布局 不 
一 样 而 各 有 不 同 。 


























在 本 例 中 , 我 们 选用 一 个 只 有 标题 和 文本 的 布局 (17 行 ), 并 填充 主 标题 (19-20 行 ), BM Shape[0] 
或 Shape (1) 一 一 Python 的 下 标 从 0 开始 ， 微 软 的 软件 从 1 开始 一 一 然后 填充 文本 (22-26 47), HD 
Shape[1] 5% Shape (2)。 为 了 了 解 要 使 用 哪 一 个 常量 ， 你 需要 一 个 所 有 可 用 的 常量 列表 。 例 如 ， 
ppLayoutText 常量 的 值 被 定义 为 2( 整 型 ), ppLayoutTitle A 1, 等 。 你 可 以 在 大 多 数 微软 VB/Office 
编程 的 书 中 或 根据 名 字 在 线 查 找 相关 的 定义 。 或 者 ， 你 也 可 以 直接 使 用 整 型 值 ， 而 不 使 用 
win32. constants 中 的 名 字 。 




















例 23. 4 PowerPoint 例子 (ppoint. pyw) 
这 个 脚本 启动 PowerPoint 并 在 约 灯 片 中 写 入 一 些 数 据 。 


Z!/usr/bin/env python 


1 

2 

a from Tkinter import Tk 

4 from time import sleep 

5 from tkMessageDox import showwarning 
6 import winó2com.client as win32 
7 
ó 


warn = lambda app: showwarning(app, 'Exit?') 
9 RANGE = range(3, 8) 


li def ppoint(: 

12 app = 'PowerPoint' 

13  ppoint = win32. gencache. EnsureDispatch( %s. Application’ % app) 
14 pres = ppoint. Presentations. Add () 

15  ppoint.Visible = True 


17 sl = pres. Slides. Add(1, win32. constants. ppLayout Text) 
18  sleep(1) 

19 sla = sl. Sbapes(0/. TextFrame. TextRange 

20 sla. Text = ’Python-to—%s Demo’ % app 

21 sleep(1) 

22  slb = sl. Shapes[1]. TextFrame. TextRange 

23 for i in RANGE: 

24  slb. InsertAfter( Line Wd|r|n^ % i) 

25  sleep(l) 

26  slb. InsertAfter( |r|nTh-th-th-that's all folks!^) 
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28 warn (app) 
29 pres. Close 0 
30  ppoint.Quit 0 


32 if name --' main 
33 TkO.mwithdraw( 
34  ppoint(Q 





23.2.5 微软 Outlook 





最 后 ， 我 们 给 一 个 0utlook 的 例子 ， 它 使 用 了 比 PowerPoint 例子 更 多 的 常量 ， 作 为 一 个 十 分 常 
见 和 通用 的 工具 软件 ， 在 应 用 程序 中 使 用 Outlook 非常 有 意义 ， 这 与 前 面 Excel 的 例子 一 样 。 总 是 
有 电子 邮件 地 址 、 邮 件 和 其 它 数据 可 以 在 Python 程序 中 轻松 地 处 理 。 例 23.5 就 是 Outlook 的 一 个 
例子 ， 但 是 比 前面 的 例子 都 要 复杂 一 点 。 


$ stock.py 














Prices quoted as of: Sat May 27 03:25:56 2006 


TICKER PRICE CHG SAGE 


YHOO 33.02 +0.10 +0.30% 
GOOG 381.35 -1.64 -0.43% 
EBAY 34.20 +0.32 +0.94% 
AMZN 36.07 +0.44 +1.23% 


图 23-3 Python-to-PowerPoint demonstration script (ppoint. pyw) 








在 这 个 例子 中 ， 我 们 用 Outlook 给 自己 发 了 一 封 电子 邮件 。 为 了 更 好 的 演示 这 个 例子 ， 你 需要 
先 关 闭 网 络 访问 ， 以 确保 你 的 email 并 不 会 真正 的 被 发 送出 去 ， 这 样 ， 你 就 可 以 在 发 件 箱 里 看 到 这 
封 邮件 (如 果 需 要 的 话 ， 还 可 以 在 看 完 后 删除 它 )。 启 动 Outlook 后 ， 我 们 写 一 封 新 的 电子 邮件 ， 然 
后 填 好 各 个 栏 ， 例 如 收 信人 、 主 题 和 信件 内 容 等 (15 - 21 行 ) 。 然 后 调用 send () (22 行 ) 将 信和 存储 到 发 
件 箱 ， 在 这 里 ， 信 件 一 旦 被 确实 发 送 到 邮件 服务 器 上 ， 就 会 被 移动 到 “已 发 送 ”。 









































象 PowerPoint 一 样 ，0utlook 有 很 多 可 以 使 用 的 常量 …… 。olMailItem( 其 值 为 0) 常量 被 用 于 
e-mail 信息 。 其 它 常用 的 Outlook 常量 有 : olAppointmentItem (1), olContactItem (2), olTaskItem 
(3) 。 当 然 ， 还 有 很 多 没有 一 一 列 出 ， 你 可 以 在 介绍 VB/Office 编程 的 书 中 或 者 在 线 文档 中 查找 相关 
AY BL hy es Y 
常量 的 定义 。 

















下 一 部 分 (24-27 行 ) ， 我 们 使 用 了 另 一 个 常量 olFolder0utbox (4) ， 来 打开 并 显示 发 件 箱 目录 ， 
我 们 找到 最 新 的 几 封 邮件 (有 可 能 是 我 们 刚刚 创建 的 )， 并 显示 它们 。 其 它 几 个 常用 的 目录 有 : 
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olFolderInbox (6), olFolderCalendar (9), elPolderContacta (10). olFolderDrafts (16), 
olFolderSentMail (5), I olFolderTasks (13). 。 如 果 你 使 用 动态 调用 ， 你 可 能 要 使 用 具体 的 数值 ， 
而 不 是 常量 的 名 字 ( 见 之 前 的 核心 笔记 )。 














例 23. 5 Outlook 例子 (olook. pyw) 
这 个 脚本 启动 0utlook， 创 建 一 封 邮件 ,“ 发 送 ” 这 封 邮 件 ， 并 人 允许 你 打开 发 件 箱 浏览 这 封 





邮件 。 

1 #!/usr/bin/env python 

2 

d from Tkinter import Tk 

4 from time import sleep 

5 from tkMessageBox import showwarning 

6 import win32com. client as win32 

Z 

8 warn = lambda app: showwarning(app, 'Exit?') 
9 RANGE = range (3, 8) 


11 def outlook: 
12 app = ’ Outlook’ 
13 olook = win32. gencache. EnsureDispatch ( %s. Application’ % app) 
14 
15 mail = olook. CreateItem(win32. constants. olMailItem) 
16 recip = mail. Recipients. Add ( you@127. 0. 0. 1’) 
17 subj = mail. Subject = ’Python-to-—%s Demo’ % app 
18 body = [Line 各 % i for i in RANGE] 
19 body. insert (0, *%s\r\n’ % subj) 
20  body.append(^|r|nTh-th-th-that's all folks!^) 
21 mail. Body = \r\n’. join body) 
22 mail. Send() 
28 
24 ns = olook. GetNamespace (“MAPI”) 
25 obox = ns. GetDefaultFolder (win32. constants. olFolderOutbox) 
26 obox. Display 0 
27  obox. Items. Item(1). Display O 
28 
29 warn (app) 
30 olook. Quit Q 
31 


if | name == main 
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33 TkO.mwithdraw() 
34 outlook 








图 23-4 为 邮件 窗口 的 的 截图 

由 于 ， 之 前 的 Outlook 总 是 被 用 于 各 种 各 样 的 攻击 中 ， 微 软 在 Outlook 中 ， 加 入 了 一 些 保护 措 
施 , 来 限制 对 通讯 短 的 访问 以 及 代表 你 发 送 邮件 。 当 外 部 程序 想 要 访问 你 的 Outlook 的 数据 的 时 候 ， 
会 弹出 一 个 如 图 23-5 所 示 的 对 话 框 ， 以 征 取 你 的 同意 。 


当 你 想 要 用 外 部 程序 发 送 邮件 的 时 候 ， 你 会 看 到 一 个 如 图 23-6 所 示 的 警告 对 话 框 。 你 必需 等 到 
计时 器 倒数 结束 后 才能 点 击 “ 确 定 ”按钮 。 








| 'you@127.0.0.1' 
Python-to-Out ook Demo 














Python-to-Outlook Jemo - 
Line 3 
Line 4 
Line 5 
Line 6 
Line 7 


Th-th-th-that's all folks! 





图 23 - 4 Python-to-Outlook 示例 脚本 (olook. pyw) 


一 旦 你 完成 了 所 有 安全 检查 ， 其 它 所 有 的 事 都 能 很 顺利 的 完成 。 也 有 一 些 软 件 可 以 帮助 你 绕 过 
这 些 检查 ， 但 它们 需要 单独 下 载 和 安装 。 

在 本 书 的 网 站 http://corepython.com 上 ， 你 能 找到 一 个 把 这 所 有 4 个 小 脚本 集成 在 一 起 的 一 
个 脚本 ， 人 允许 用 户 选择 要 运行 哪 一 个 示例 。 


Microsoft Office Outlook 





e. 
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图 23 - 5 Outlook Hh fj jn] es 
Microsoft Office Outlook x| 
d 4 program is trying to automatically send e-mail on your 
AUN behaf. 
Do you want to allow this? 





If this is unexpected, it may be a virus and you should 
choose "No", 


PETIT TTT | 


Hep | 











图 23-6 Outlook 电子 邮件 传输 警告 


23. 2.6 中 等 规模 的 例子 





现在 ， 我 们 对 Office 编程 已 经 有 了 一 些 概念 ， 接 下 来 ， 我 们 要 把 本 节 所 列 的 知识 与 Web 服务 那 
一 节 的 知识 组 合 起 来 ， 写 一 个 更 实用 的 应 用 程序 。 如 果 我 们 把 股票 报价 的 例子 与 Excel 演示 脚本 合 
起 来 ， 就 能 形成 一 个 能 从 网 上 下 载 股票 报价 ， 并 把 结果 直接 放 到 Excel 中 的 应 用 程序 ， 而 不 用 把 数 
据 放 在 CSV 文件 中 做 为 中 介 。 


| 逐 行 解 释 
Lines 1-13 


我 们 导入 股票 报价 和 Excel 脚本 两 个 例子 中 的 所 使 用 的 模块 与 常量 。 








Lines 15- 32 

核心 功能 的 第 一 部 分 是 像 之 前 那个 脚本 (17-21 行 ) 那 样 启动 Excel。 把 标题 和 时 间 写 到 相应 的 单 
元 格 中 (23-29 行 ) ， 然 后 是 粗 体 (30 行 ) 的 列 的 头 。 从 第 6 行 开始 (32 行 ) 的 单元 格 会 写 入 实际 的 股票 
报价 的 数据 





Lines 34 - 43 
如 同 之 前 一 样 ， 打 开 一 个 URL(34 行 )， 但 不 再 把 结果 写 到 标准 输出 ， 我 们 把 结果 填 到 电子 表格 
的 单元 格 中 。 一 次 放 一 列 数据 ， 每 行 一 个 公司 的 股票 信息 (35-42 17) 。 








Lines 45-51 
脚本 的 剩 下 几 行 作用 与 之 前 看 到 的 一 样 。 


例 23.6 股票 报价 与 Excel 例子 (estock. pyw) 
这 个 脚本 从 Yahoo! 下 载 股票 报价 并 把 数据 写 入 到 Excel. 
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Z!/usr/bin/env python 


from Tkinter import Tk 

from time import sleep, ctime 

from tkMessageDox import showwarning 
from urllib import urlopen 

import win32com. client as win32 


SAN y S n &Ww NSS : 


warn = lambda app: showwarning (app, 'Exit?') 
RANGE = range(3, 8) 


M 
SS 


11 TICKS = ( YHOO’, 'GOO0G', 'EBAY', ’ AMZN ) 

12 COLS = ( TICKER’, 'PRICE', 'CHG', ’ GAGE’) 

13 URL = 'http://"quote. yahoo. com/d/quotes. csv?s=%skf=sllclp2’ 
14 

15 def excel Q: 

16 app = 'Excel' 

17 xl = win82. gencache. EnsureDispatch ( %s. Application’ % app) 


18 ss = xl. Workbooks. Add() 

19 sh = ss. ActiveSheet 

20 xl. Visible = True 

21 sleep (1) 

22 
23 sh. Cells(1, 1). Value = ’Python-to-—%s Stock Quote Demo’ % app 
24 sleep(1) 
25 sh. Cells(3, lI). Value = 'Prices quoted as of: %s’ % ctime 0 
26 sleep(1) 
27 for i in range(4): 
28 sh. Cells(5, itl). Value = COLS[i/ 
29 sleep(1) 
30 sh. Range(sh. Cells (5, 1), sh. Cells (5, 4)). Font. Bold = True 
31 sleep (1) 
32 row =6 
33 
34 u = urlopen(URL % ’,’. join(TICKS)) 
35 for data in u: 
36 tick, price, chg, per = data. split(, ) 
37 sh. Cells(row, 1). Value = eval (tick) 
38 sh. Cells(row, 2). Value = C% 2f' % round (float (price), 2)) 
39 sh. Cells(row, 3). Value = chg 
sh. Cells (row, 4). Value = eval (per. rstrip()) 
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4l row t= 1 

42 sleep(1) 

43  u.close() 

44 

45  warn(app) 

46 ss. Close (False) 

47 xl. Application. Quit Q 








48 

49 if name --' main 
50  TkO.withdrawQ 

51 excell 


23 -7 显示 的 是 ， 运 行 了 我 们 的 脚本 后 ， 有 实际 数据 的 窗口 。 


图 Microsoft Excel - Book1 | - [B] x] 

:| File Edit view Inset Formet Tools Data ‘Window Help 

: Adobe FDF -7 X 
Al * A Python-to-Excel Stock QJote Demo 


[5 [TICKER PRICE CHG "SAGE 
33.02 01 0.30% 


381.35 -1.64  -0.4396 
34.2 0.32 0.94% 
36.07 0.44 





23-7 Python-to-Excel 股票 报价 示例 脚本 (estock. pyw) 


注意 ， 存 放 数 字 的 那 几 列 的 原始 格式 信息 已 经 没有 了 ， 因 为 ，Excel 用 默认 的 单元 格格 式 把 它们 
存 为 数字 了 。 我 们 把 数字 的 格式 改 为 保留 小 数 点 后 两 位 。 虽 然 Python 传 的 是 ”34. 20”， 但 显示 的 时 
候 ， 还 是 显示 ”34.2”。 而 “ 自 上 次 收盘 的 变动 ” 那 一 列 ， 则 不 仅 少 了 小 数 点 后 的 数字 ， 而 且 ， 数 字 
前 面 的 用 于 表示 升值 的 正 号 (+) 也 没 了 。 (这 是 Excel 的 输出 和 原始 文本 版 的 比较 。 这 些 问题 在 本 章 
结尾 的 练习 中 有 详细 说 明 。) 








23.3 FA Jython 5j Python 和 Java 的 程序 
23. 3. 1 什么 是 Jython 


IN 





aa + 
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Jython 是 一 种 可 以 把 两 种 不 同 的 编程 语言 结合 在 一 起 的 工具 。 首 先 ,， 它 使 Python 程序 员 介入 到 
Java 开发 环境 并 让 他 们 能 快速 开发 方案 原型 ， 以 便 无 颖 地 集成 到 现 有 的 Java 平台 上 。 其 次 ， 它 能 在 
Java 中 加 入 脚本 语言 ， 并 以 此 来 简化 数 计 百 万 计 的 Java 程序 员 的 工作 。Java 程序 员 们 ， 再 也 不 用 
为 他 们 刚 写 的 一 个 类 写 一 大 堆 的 测试 用 例 或 驱动 程序 。 



































Jython 提供 了 Python 的 大 部 分 功能 ， 以 及 实例 化 Java 类 并 与 Java 类 交互 的 功能 。Jython ft 
码 被 动态 地 编译 成 Java 字 节 码 , 因此, 你 可 以 用 Jython 扩展 Java 类 。 也 可 以 用 Java KH Pythons 
在 Python 中 写 一 个 类 ， 像 使 用 Java 类 一 样 使 用 这 个 类 是 很 容易 的 事情 。 你 甚至 可 以 把 Jython 脚本 
静态 地 编译 为 Java 字 节 码 。 





你 可 以 从 本 书 的 网 站 或 http://jython. org 下 载 Jython。 在 安装 完 , 并 阅读 了 一 些 处 理 新 的 . jar 
文件 的 默认 启动 注意 事项 后 ， 启 动 Jython 的 交互 解释 器 就 跟 用 Python 一 样 简单 。 而 且 ， 你 也 可 以 
像 在 Python 中 一 样 ， 写 一 个 “Hello World!”: 

















$ Jython 
Jython 2. 2al on javal. 4.2.09 (JIT: null) 
Type “copyright”, “credits” or “license” for more information. 
2» print "Hello World!’ 
Hello World! 
225 
222 import sys 
222 sys. stdout. write C Hello World! |n') 
Hello World! 


唯一 的 不 同 是 ， 现 在 ， 你 不 得 不 等 待 Java 那 超 长 的 启动 时 间 。 如 果 你 能 忍受 这 个 ， 你 就 能 做 一 
些 更 有 用 的 事 了 。 用 Jy thon 交互 解释 器 的 一 个 更 有 趣 的 方面 就 是 , 现在 , 你 可 以 用 Java X5 “Hello 
World!" J: 


222 from Java. lang import System 
22» System. out. write C Hello World! |n') 
Hello World! 


Java 28 f Python 用 户 一 些 额外 的 好 处 ， 即 可 以 使 用 本 地 异常 处 理 (这 在 标准 Python 一 一 相对 于 
其 它 实 现 来 说 ， 也 被 称 为 “CPython” 一 一 里 是 没有 的 。) 以 及 可 以 使 用 Java 的 垃圾 收集 器 (这样 就 
没 必 要 再 为 Java 开发 一 套 Python 的 实现 了 ) 。 











23.3.2 Swing GUI FÈ (Java 或 者 Python!) 


E 





[e— 一 * 一 
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具有 对 所 有 Java 类 的 访问 能 力 ， 我 们 能 做 的 事 束 太 多 了 。 比 方 说 ， 图 形 界面 (GUI) 的 开发 。 在 
Python 中 , 我 们 用 Tkinter 模块 中 的 Tk 做 为 默认 GUI, 但 是 , Tk 不 是 Python 的 本 地 工具 包 。 不 过 ， 
Java 有 Swing, 它 是 本 地 的 。 用 Jython, 我 们 可 以 用 Swing 组 件 写 一 个 GUI 应 用 程序 , 不 是 用 Java, 
而 是 用 Python。 





一 个 简单 的 “Hello World!" GUI 程序 的 Java 版 本 和 对 应 的 Python 版 本 分 别 在 例 23.7 和 23. 8 
中 给 出 。 这 两 个 版 本 都 模仿 了 图 像 界 面 编程 那 一 章 的 Tk 例子 tkhello3. py。 这 两 段 程序 分 别 叫 
swhello. java 和 swhello. py. 





4| 23.7 Java fH, Ħ Swing & “Hello World"  (swhello. java) 
本 程序 像 tkhello3. py 那样 ， 创 建 一 个 GUI。 使 用 Swing 而 不 是 TIk。 使 用 的 语言 是 Javas 





import java. awt. *; 
import Java. awt. event. *; 
import javax. swing. *, 
import java. lang. *; 


DAK WH lh ~ 


public class swhello extends JFrame { 

7 JPanel box; 

8 JLabel hello; 

9 JButton quit; 

10 
li public swhelloQ { 
12 super( JSwing?); 

BorderLayout 0); 

13 JPanel box = new JPanel (new 
14 JLabel hello = new JLabel (Hello World!”); 
15  JButton quit = new JButton( QUIT?) ; 
16 
17 ActionListener quitAction = new ActionListener() { 
18 public void actionPerformed (ActionEvent e) { 
19 System. exit (0) ; 
20 ] 
21 j; 
22 quit. setBackground (Color. red); 
23 quit. setForeground (Color. white); 
24 quit. addActionListener (quitAction); 
25 box. add(hello, BorderLayout. NORTH) ; 
26 box. add(quit, BorderLayout. SOUTH) ; 
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28 | addWindowListener(new WindowAdapter() { 
29 public void windowClosing WindowEvent e) { 
30 System exit (0); 





Jl jJ 

s wj 

33  getContentPane (). add (box) ; 
34 pack; 

35  setVisible(true); 

36 y 

37 


38 public static void main(String args[]) { 
39  swhello app = new swhello(; 

40 ] 

41 ] 


4| 23. 8 Python 4, Hj Swing 5 “Hello World"  (swhello. py) 
下 面 的 Python 脚本 代码 具有 和 上 面 的 Java 程序 具有 相同 的 功能 , 需要 在 Jy thon 解释 器 中 执行 。 











1 #!/usr/bin/env jython 
2 
3 from pawt import swing 
4 import sys 
ófrom java. awt import Color, BorderLayout 
6 
7def quit(e): 
8sys. exit 0 
9 
10  top- swing. JFrame ( PySwing ^) 
77 box = swing. JPanel () 
12 hello = swing. JLabel (Hello World! ^) 
13 quit = swing. JButton QUIT^, actionPerformed=quit, 
14 background=Color. red, foreground=Color. white) 
15 
16 | box. add(North’, hello) 
17  box.add( South/, quit) 
18 top. contentPane. add (box) 
19 top. pack () 
20 top. visible = 1 £ or True for Jython 2. 2+ 


两 段 代 码 都 与 tkhello3. py 一 致 ， 唯 一 的 区 别 就 是 它们 使 用 了 Swing 而 不 是 Tk. Python 版 本 的 
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特点 是 ， 做 同样 的 事 ，Python 所 要 写 的 代码 相 比 Java 大 幅 减少 。Python 代码 的 表达 能 力 更 强 ， 所 
以 ， 每 一 行 都 显得 更 为 重要 。 简 单 地 说 ， 就 是 “白色 噪音 ”更 少 了 。Java 的 代码 更 趋向 于 用 更 多 的 
“样板 ”代码 来 完成 工作 ， 而 Python 则 证 你 把 注意 力 集中 在 你 的 应 用 的 重要 部 位 ， 即 你 要 解决 的 问 
题 的 解决 方案 上 。 











由 于 两 个 程序 都 会 被 编译 为 Java 字 节 码 ， 在 同一 个 平台 上 两 个 程序 看 上 去 完全 一 样 也 就 没什么 
好 奇怪 的 了 ( 见 图 23-8) . 





Jython 是 一 个 很 伟大 的 工具 。 因 为 ， 你 同时 得 到 了 Python 的 强大 的 表达 能 力 ， 以 及 Java 库 中 
丰富 的 API。 如 果 你 现在 是 一 个 Java 程序 员 ， 希 望 我 们 已 经 引起 了 你 对 你 身后 Python 强大 力量 的 兴 
趣 。 如 果 你 是 Java 新 手 ，Jython 能 让 你 更 为 轻松 。 你 可 以 用 Jython 写 原型 , 然后 ,在 必要 的 时 候 ， 
轻松 的 移植 到 Java 中 。 
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Java Python 


23-8 Swing HY Hello World 示例 脚本 (swhello. java 和 swhel lo. py) 
23.4 练习 


Web 服务 


23-1. Web 服务 。 使 用 yahoo! 股 票 报价 示例 (stock. py) 并 把 这 个 程序 改 为 把 报价 数据 保存 到 一 
个 文件 中 ， 而 不 在 屏幕 上 显示 。 可 选 题 : 你 可 以 修改 脚本 ， 让 用 户 可 以 选择 是 显示 报价 还 是 保存 到 
PEU 














23-2. Web 服务 。 修 改 yahoo! 股 票 报价 示例 (stock. py) ， 让 程序 可 以 下 载 上 面 所 列 的 其 它 参 数 
数据 。 可 选 题 : 你 可 以 把 这 个 功能 加 到 上 一 题 的 程序 中 。 


23-3. Web 服务 和 csv 模块。 修改 stock. py， 像 我 们 在 示例 代码 中 那样 ， 使 用 csv 模块 来 解析 
得 到 的 数据 。 附 加 题 : 用 同样 的 方法 修改 这 个 脚本 的 Excel 版 本 (estock. py) 。 


23-4. REST 与 Web 服务 。 学 习 现 在 的 Web 服务 APIs 和 应 用 程序 中 ，REST 与 XML 是 如 何 被 使 用 


IN 








: $— —$— —+ 
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的 。 与 老式 的 Web 服务 , 像 Yahoo! 报 价 服务 这 种 用 URL 参数 的 方式 相 比 较 , 额外 提供 了 哪些 的 功 23-5. 
REST 与 Web 服务 。 利 用 Python 对 REST 和 XML 的 支持 ， 创 建 一 个 应 用 程序 的 框架 ， 这 个 框架 要 能 在 
写 使 用 如 今 这 些 更 新 的 Web 服务 和 API 应 用 程序 的 时 候 ， 能 实现 代码 的 共享 和 重用 。 展 示 你 的 使 用 
Yahoo!, Google, eBay 及 (或 ) Amazon 服务 的 代码 。 
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23-6 微软 Excel 和 网 页 。 创 建 一 个 应 用 程序 ， 读 取 Excel 电子 表格 中 的 数据 ， 并 生成 一 个 对 应 
的 HTML 表格 。( 你 可 能 需要 第 三 方 的 HTMLgen 模块 ) 











23-7， 微 软 Office 应 用 程序 与 Web 服务 。 连 接 到 任何 现 有 的 Web 服务 ， 无 论 是 基于 REST 还 是 
URL 的 ， 

并 把 数据 写 到 Excel 电子 表格 中 ， 或 设置 一 个 比较 好 看 的 格式 ， 然 后 放 到 Word 文档 中 。 格 式 要 
适 于 打印 。 附 加 题 : 要 同时 支持 Excel 和 Word. 











23-8. 微软 Outlook 和 Web 服务 。 与 之 前 的 问题 相似 ， 做 同样 的 事情 ， 并 把 数据 放 到 一 封 新 的 
email 中 ， 并 用 Outlook 发 送出 去 。 附 加 题 : 做 同样 的 事 , 但 是 用 普通 的 SMTP 服务 器 来 发 送 email, 
而 不 使 用 0utlook。( 你 可 能 想 要 参考 第 17 章 Internet 客户 端 编程 ) 














23-9， 微 软 PowerPoint。 设 计 一 个 演示 文档 生成 器 。 设 计 一 种 用 Word， 或 普通 文本 编辑 器 就 
能 生成 的 文本 文件 的 格式 。 从 遵循 该 格式 的 文本 文件 中 ， 读 出 要 演示 的 数据 ， 并 生成 对 应 的 
PowerPoint 约 灯 片 放 在 一 个 演示 文档 中 。 





23-10， 微 软 0utlook， 数 据 库 和 你 的 地 址 夭 。 写 一 个 程序 ， 从 Outlook 的 地 址 筹 中 读 出 数据 ， 
把 想 要 的 字段 保存 到 数据 库 中 。 数 据 库 可 以 是 一 个 文本 文件 ，DBM 文件 ， 或 是 一 个 关系 数据 库 。( 你 
可 能 想 要 参考 第 21 章 ， 数 据 库 编 程 )。 附 加 题 : 完成 反 向 的 工作 。 即 ， 从 数据 库 〈 或 允许 用 户 直 接 
输入 ) 中 读 取 联系 人 的 信息 ， 添 加 或 更 新 记录 到 Outlook 中 。 














23-11. PAEK Outlook 和 Email。 开 发 一 个 程序 读 取 收 件 箱 和 (或 ) 其 它 重要 的 文件 夹 的 数据 ， 
并 把 它们 用 普通 的 “box” 格 式 保存 到 磁盘 上 。 





23-12. 微软 Outlook 日 历 。 写 一 个 脚本 创建 新 的 Out look 任务 。 至 少 要 允许 用 户 输入 以 下 信息 : 
开始 日 期 和 时 间 ， 任 务 名 字 或 主题 以 及 任务 持续 时 间 。 





23-13. 微软 Outlook 日 历 。 创 建 一 个 应 用 程序 ， 导 出 你 的 所 有 任务 信息 到 一 个 你 指定 的 地 方 ， 
如 ， 屏 幕 上 ， 数 据 库 里 ，Excel 里 等 。 附 加 题 : 程序 也 要 可 以 导出 Outlook 任务 。 











23-14， 多 线程 。 修 改 股票 报价 下 载 脚本 (estock. pyw) ， 使 用 多 个 Python 线程 ， 让 数据 下 载 部 
分 可 以 “并 行 ”% 可 选 题 : 你 也 可 以 试 试用 win32process. beginthreadex() 来 产生 VisualC++ 的 线程 
来 做 这 一 题 。 
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23-15. Excel 单元 格格 式 。 在 股票 报价 下 载 脚本 (estock. pyw) 的 电子 表格 版 本 中 , 我 们 在 图 23-7 
中 看 到 股票 价格 并 不 是 默认 到 小 数 点 后 两 位 ， 就 算 我 们 传 进去 的 是 有 后 缀 0 的 也 不 行 。 当 Excel 把 
这 个 字符 串 转 为 数字 的 时 候 ， 就 自动 使 用 数字 格式 的 设 定 。 

(a) 把 单元 格 的 NumberFormat 属性 设 为 “0. 00” 就 可 以 把 数字 的 格式 正确 的 设 定 为 两 个 小 数位 。 

(b) 我 们 也 看 到 “上 自 上 次 收盘 的 变动 ” 那 一 列 除 了 小 数 点 后 的 小 数 之 外 , 还 丢 了 “+” 号 。 可 是 ， 

方法 (a) 中 的 修正 方法 只 能 解决 小 数 点 后 的 小 数 的 问题 。 对 所 有 的 数字 ， 那 个 正 号 都 会 被 自动 丢 
掉 。 解 决 方法 是 ， 把 这 一 栏 设 为 文本 ,而 不 是 数字 。 你 可 以 把 单元 格 的 NumberFormat 属性 设 为 “@” 
来 解决 这 个 问题 。 

(c) 问题 是 , 把 单元 格 的 格式 由 数字 改 为 文本 的 一 个 问题 是 , 我 们 丢失 了 数字 的 自动 对 齐 方式 。 
在 (b) 的 解决 方案 之 外 ， 还 要 再 设置 单元 格 的 HorizontalAlignment 属性 为 Win32Excel 的 xlRight 
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当 你 完成 了 上 面 三 部 分 后 ， 你 的 输出 结果 看 上 去 就 更 令 人 满意 了 。 如 图 23-9. 


图 Microsoft Excel - Book1 | - [El x] 

ZH File Edit View Inset Formet Tools Data Window Help 

: Adobe FDF -3X 
Al M Á Pythan-ta-Excel Stock Quote Demo 








|5 [TICKER PRICE CHG % AGE 

| B |YHOO 33.02 0.10 — 0.3096 
| 7 [GOOG 381.35 -1.64| -0.43% 
18 |EBAY 34.20 40.32) 0.94% 
19 |AMZN 36.07 +0.44 1.23% 


bint >l 





图 23-9 改进 Python-to-Excel 股票 报价 脚本 (estock. pyw) 


Java，Python，Jython 


23-16. Jython. Jython 5 CPython 的 区 别 是 什么 ? 





23-17. Java 和 Python。 选 一 个 已 经 存在 的 Java 应 用 程序 ， 移 植 到 Python 中 。 在 日 记 中 写 下 











你 的 经 验 。 完 成 后 ， 总 结 一 下 ， 都 有 哪些 事 是 必需 要 做 的 ， 最 重要 的 步骤 是 什么 ， 移 植 的 中 一 定 要 


做 的 ， 公 共 的 部 分 有 哪些 。 


23-18. Java 和 Python。 研究 Jython 的 源 代码 。 描 述 一 些 Python 标准 类 型 是 如 何在 Java 中 实 





现 的 。 
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23-19. Java 和 Python. H] Java 写 一 个 扩展 来 扩展 Python。 哪 几 步 是 必要 的 ? 在 Jython 交互 
解释 器 中 演示 你 的 结果 。 








23-20. Jython 和 数据 库 。 从 第 21 章 中 找到 一 个 比较 有 意思 的 练习 ， 移 植 到 Jython 中 。Jython 
最 好 的 一 件 事 就 是 ,在 2. 1 版 本 开始 ， 它 自 带 了 一 个 JDBC 数据 库 模 块 叫 zxJDBC， 而 且 它 基本 上 遵循 
Python DB-API 2. 0 版 本 协议 。 





23-21. Python 和 Jython。 找 到 一 个 目前 Jython 中 还 没有 的 Python 模块 ， 并 移植 它 。 并 考虑 
把 移植 的 结果 做 为 一 个 补丁 提交 给 Jython 发 布 版 。 
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